来源:互联网 更新时间:2026-06-12 15:04
最近,AI圈里有个挺有意思的发现:MiniMax的M2系列模型,在输出特定人名“马嘉祺”时,表现有点不对劲。这事儿很快引起了开发者的注意。MiniMax官方反应迅速,立刻展开了全链路排查,并发布了一份详细的技术报告。报告揭示的问题,比一个名字的输出异常要深刻得多——其根源在于

问题到底出在哪儿?排查后发现,分词器将“马嘉祺”切分成了 ['马', '嘉祺']。其中,“嘉祺”这个词在预训练阶段出现频率其实不低,因此被合并成了一个独立的Token(编号190467)。然而,到了决定模型对话能力的“后训练”阶段,情况就变了——包含这个Token的训练样本,竟然不足5条。
这种极低的曝光率,导致该Token在模型的向量空间里长期“坐冷板凳”,得不到有效的优化和更新。与此同时,那些高频出现的Token,比如各种代码符号、工具调用标记,却在频繁地更新迭代。结果就是,低频Token被高频Token不断“挤压”,在向量空间中发生了偏移。模型虽然还记得“马嘉祺”这个知识概念,但输出对应正确Token的能力却丧失了,只好退而求其次,选择发音相近的“佳琪”或“琪琪”来替代。
这可不是个例。通过对20万词表的全面扫描,MiniMax发现大约有
更有意思的是,退化名单里还躺着大量互联网上的SEO垃圾词,比如“传奇私服”、“无痛人流”等等。这些词汇在高质量的对话数据中几乎绝迹,模型在后训练过程中接触不到,于是便自然而然地将其“遗忘”了。
针对这个系统性难题,MiniMax提出了三项核心的修复策略:
《Off Campus》第二季官宣:这对CP还在,但不再是主角
和平精英如何做到压枪稳-和平精英怎样才能压枪稳
下载浏览器app下载安装选择推荐
免费影视剧APP推荐
客单价碾压宝马奥迪!极氪5月交付新车34377辆:连续4个月双增长
儿子穿新中式现身大会堂 马斯克罕见用中文回应:他正在学习普通话
Elysium Above 履云录官网在哪下载 最新官方下载安装地址
DOTA2 TI时隔七年重返上海!门票6月10日开抢,国服享受优先购买!
HBO 奇幻剧《龙之家族》第三季定档 6 月 22 日,最终预告片曝光喉道海战
抖音最火沙雕男生网名(精选100个)
帅气继父网名女生可爱英文(精选100个)
网络热词聊污是什么意思
阿里发布Qwen3.7-Max大模型,全球第五、国产第一
SpaceX狂揽AI人才,马斯克亲自面试且不看简历背景
金铲铲之战s17六暗星卡莎阵容玩法构筑指南
免费看电影的软件推荐
我的末日校园海斗手游上线时间是哪天
名单曝光!库克、马斯克等将随团到访中国 黄仁勋不在其中
晨字沙雕网名大全女生(精选100个)
短剧《情绪超市》剧情介绍
手机号码测吉凶
本站所有软件,都由网友上传,如有侵犯你的版权,请发邮件haolingcc@hotmail.com 联系删除。 版权所有 Copyright@2012-2013 haoling.cc