来源:互联网 更新时间:2026-06-17 14:08
最近用DeepSeek做了一系列教育实验,结果一次次让人眼前一亮。挑几个片段整理出来,希望能给你带来启发——当然,也欢迎你在和DeepSeek聊出有趣内容后,来分享你的“哇塞”时刻。
今天这篇为了阅读方便,先把重新排版后的对话贴出来(严格保留原始对话,包括AI翻车的那部分),然后是R1思考过程中的亮点,最后是它与O3-mini-high的对比。
AI肯定能成为老师和父母的得力助手,帮我们应对孩子层出不穷的“十万个为什么”。但关键问题是:如果不想让孩子觉得“反正问AI就行,我不用学了”,那就不能让AI直接甩答案。更好的方式,是让AI引导孩子自己去找答案,还能顺势拓展,用更多相关的问题点燃孩子更强的求知欲。
所以,设计了一个循循善诱的科学老师角色:面对孩子的任何问题,它首先会澄清问题、搞明白孩子为什么这么问;接着思考相关的知识点,提炼出关键问题;最后引导孩子观察现象、提出猜想并验证,最终才给出解释,再用拓展问题引出更多思考。
之前用Claude 3.5或O1时,这套提示词只能让老师从回复中获得一些启发,借鉴到和孩子的讨论中。那么,DeepSeek-R1的表现如何?来看例子——
问题来自一套非常可爱的书的第一节:为什么水是湿的。

整个对话中,因为故意误导,R1也出现了好几次胡说八道。但坦率地说,真人老师面对孩子的任意问题,或许会犯比AI更多的错误。可以尝试把metaso、幻觉小模型和R1结合起来使用,应该能比较有效地避免这类问题。最近R1太不稳定,等后续稳定了再来尝试。
这段对话里最让人喜欢的一点是,AI用通俗易懂的方式给出了大量日常生活中的相关现象——孩子的一个问题裂变成好几串问题,简直像好奇心的永动机。甚至给得太多了?这时需要陪孩子的成年人观察一下孩子的接受度,别被AI砸懵。
这次使用的提示词如下图。如果给求知欲旺盛的孩子用,可以考虑调整一下,让AI提及更多专业术语并简单解释。

R1和孩子的对话清晰简洁,但内心戏其实非常多,思考过程中藏着很多给人启发的火花。提示词和完整对话,都可以在后台查看。

最后,给大家看个笑话吧。下图是OpenAI刚发布的O3-mini-high,和之前O1-Preview刚推出时很像——经常出现离谱的伪思考(调和酒精和蜜糖创造一种平衡的味道?O3你是认真的吗?!)。前些天看到拾象闭门会讨论内容中,提及模型会“先去生成没有用的想法,然后最后突然答对,原因在于很多RL hack做得非常隐晦,模型可能在预训练的时候背了很多问题,所以明面上是在思考,其实只是在靠近背的题。”这和用O家推理模型的体感非常一致。难道是只追求scaling law,练出了会背很多题的书呆子?
使用O1的体感,甚至一度让人坚信让AI自己拆解问题、评估回答、左脚踩右脚,是踩不出AGI来的。好在,现在有在深度思考上断崖式领先的R1让人重新看到希望。嗯,该去认真读读R1-zero的论文了。从目前R1带来的惊喜看,这真的是AlphaZero级别的突破。
《Off Campus》第二季官宣:这对CP还在,但不再是主角
和平精英如何做到压枪稳-和平精英怎样才能压枪稳
客单价碾压宝马奥迪!极氪5月交付新车34377辆:连续4个月双增长
HBO 奇幻剧《龙之家族》第三季定档 6 月 22 日,最终预告片曝光喉道海战
DOTA2 TI时隔七年重返上海!门票6月10日开抢,国服享受优先购买!
帅气继父网名女生可爱英文(精选100个)
帅到极致的网名女生霸气(精选100个)
蒙古上单是什么梗
韦一敏是什么梗
网络热词聊污是什么意思
作家助手如何上传自制封面 作家助手如何设置小说的封面
抖音最火沙雕男生网名(精选100个)
韩漫小少爷网名大全女生(精选100个)
有寓意的易经网名男生(精选100个)
因空难被判“过失杀人罪” 空客、法航均被顶格处罚22.5万欧元
免费看电影的软件推荐
金铲铲之战s17六暗星卡莎阵容玩法构筑指南
SpaceX狂揽AI人才,马斯克亲自面试且不看简历背景
如何在夸克浏览器中开启网页视频的倍速播放功能?
三角洲行动卡战备怎么弄 三角洲行动卡战备攻略
手机号码测吉凶
本站所有软件,都由网友上传,如有侵犯你的版权,请发邮件haolingcc@hotmail.com 联系删除。 版权所有 Copyright@2012-2013 haoling.cc