来源:互联网 更新时间:2026-06-20 15:53
最近一直在想写点应用、开发相关的东西,一方面是不停有企业和朋友问他们能用DeepSeek做什么、怎么用;另一方面则是发现这个方向的职业和行业,已经在不知不觉中慢慢变了。索性一并梳理一下,记录在案。

主要从就业、应用和研究三个方面展开讨论。
DeepSeek或者说ChatGPT的爆火,最先感受到压力的,无疑是一线的NLP和LLM从业者。专门做大模型的团队本来就凤毛麟角,门槛更是高得吓人,所以大多数从业人员还是扎堆在“应用”和“业务”一侧。但LLM的发展又如此迅猛,搞应用的门槛却在不断降低——这一点在23年的《ChatGPT 影响冲击:职业、行业与产业 | Yam》[1]一文中就提到过,当时就已经感受到了焦虑。R1出来后,几乎所有的LLM都会“R1一下”,而且模型还在不断进化。LLM越来越聪明,焦虑也跟着越来越多。
现在一个明显的趋势是:大量的应用相关职位都变成了Agent开发,不再需要训练模型,但对工程能力提出了要求;反过来,如果是工程开发人员,则要求了解算法基本知识。按说职位变多应该让人安心才对,但事实是虽然职位多了,“好职位”却不多。更麻烦的是,因为职位变多,涌入的人也更多了——包括之前搞NLP的、搞开发的、其他领域转行的,还有大量毕业生。这个趋势不可阻挡,而且只会愈演愈烈。当LLM聪明到一定程度后,剩下的就是大量的应用工作。LLM还要不要继续研究?当然要。但那只是不到1%的人和企业要做的事。突破是渐进式的,不可能一步跨出一大步。足够聪明的LLM已经足够在很多地方发力了,整个社会的跟进需要时间。等到下一次大突破,无非就是重新再来一遍现在的循环。
一年前的Agent可能还比较简单,现在的Agent已经相当复杂了。虽然一句话完成一个需求(如MetaGPT[2])目前大部分时候还不可用,但这一定是暂时的。一方面AI还在不断进步,另一方面,Agent相关的标准也在不断完善(如MCP[3])。一旦很多东西标准化了,AI表现出来的威力会突破性地加强。从实际经验来看,目前的Agent在做复杂任务时有一个很大的毛病——中间某个环节出问题后,需要耗费非常多的时间和Token才有可能解决,很多时候还解决不了。这当然可能是AI不够聪明,但更多的问题还是标准化不足,类似MCP这样的协议有望解决这一问题。
顺便科普一下:简单来理解,MCP就是把与LLM交互的各种组件统一成不同的模块服务,它提供了一种将AI模型连接到不同数据源和工具的标准化方式。从LLM的角度看,它标准化了应用程序如何为LLM提供上下文。举个例子,比如你让LLM帮你在电脑里找一个文件,一般我们都会借助一个软件来完成(比如Windows的Everything、Linux的find命令等),这时候就可以写一个类似的Server(比如就叫Everything MCP Server),然后LLM就通过这个Server使用具体的软件。LLM侧是比较清爽简单的,所有“变”和“不一样”的东西都放在这个MCP Server这里,类似于一个适配于LLM的Adapter。只能说,潜力无限!在此之上就是各种Agent工具,比如现在比较有名的扣子,它允许用户通过工作流的方式创建复杂Agent和应用。相信它底层的通用模块应该也是有类似MCP Server这样的Adapter的。随着Agent和应用不断复杂,是一定需要单独抽一层这样的Adapter出来的。
多模态自不必说,就LLM方向也还有蛮多可以做的,尤其是和RL结合,大有可为(具体可参考 hscspring/rl-llm-nlp: Reinforcement Learning in LLM and NLP[4])。这里有两个明显的感觉。第一,LLM相关的前沿论文大部分都来自国内机构或华人作者,这个趋势近两年越来越明显,中国人的卷真不是吹的。第二,高品质前沿资料也开始集中在中文社区,尤其是知乎和微信公众号,有不少高质量的内容,虽然也不是很多,但相比英文社区反倒好些。现在搜索前沿内容,能搜到的英文社区资料越来越少了。感觉R1之后,算法领域国内比国外沸腾得更厉害。
另一个方向是模型架构方面的优化。DeepSeek在这方面走得很快,近期提出了NSA[5],Kimi也提出了类似的MoBA[6],以及优化了新的更省资源的优化器Muon[7],还有YOLU-12[8]对Attention架构的优化,近期何恺明大神的Transformers without Normalization[9]。相关的工作层出不穷,而且都相当有吸引力。量化、蒸馏方向也不断有新的成果出现。
除此之外,Agent方向的算法也在逐步发展,比如搞Scaling的camel[10],以及相关的应用OWL[11],还有相关的具身智能、世界模型。AI方向的研究如火如荼。
值得一提的是,以上提到的很多研究都是国内公司或华人主导。R1之后,据说很多之前专搞LLM的都压力山大,不知又在埋头憋什么大招。AI可能从来没像今天这样繁荣。
这部分主要梳理岗位和职业方向的变化。
这里主要探讨一下大部分LLM算法工程师这个职业的工作内容,目前看来主要是下面这么几个方向。
第一,基于LLM做业务开发。说到做业务,Agent就是标配,最简单的Agent就是一个LLM+RAG,复杂的就涉及到多个LLM、多个环节、多个组件。这个工作内容的工程能力要求大于算法能力,尤其是架构设计能力。
第二,LLM模型优化。R1后出现了一些新的范式,让我们有可能用更低的成本和更小的模型达到更好的效果,小模型(SLM)的春天来了。无论从成本、效率还是端侧部署考虑,模型优化都值得投入,但投入确实不需要那么多。因为推理方向进展太迅速,成本下降趋势明显,当大模型的推理成本低到一定程度时,优化小模型就显得多此一举了。同等条件下模型越大效果越好,这是真理。
第三,Agent交互优化。这是个老瓶装新酒的方向,其实就是LLM前用强化搞Agent那一套。目前研究还不多,主要是业界都还处于“构建”Agent阶段,这个属于优化方向。等大部分Agent构建完成要进一步提升效果时,老瓶的RL可能会登场。
以上三个职位数量是逐个下降的,第一个应该能占到80%。这里没有写推理方向,因为这个方向只能往底层做,那要求很高,而且其实算是另一个方向了。上层没太多意义,都是工具,而且部署大模型和业务是相对独立的,用户切换完全没成本,谁好谁快就用谁。从VLLM到SGLang就可见一斑。
除此之外,在专用领域做专用LM(Large Model)也是个不错的方向,但职位应该也不太多。顺便提一下,垂直领域(比如医疗、金融等)LLM并非特别看好,但非常看好专用领域(比如时序、分子)LM,后者的Token不再是文本。理由很简单:LLM足够聪明时,只要给它提供足够充分的上下文,应该足以解决大部分问题。
这部分主要针对从业者自身,不一定对每个人都有帮助,请谨慎参考。
在2023年初开始做LLM,一年后感觉模型本身好像没啥可做的了,于是转向多模态做了一年,主要是文本+语音合成方向。R1出来后又重新思考方向,最终结论是:LLM依然是核心,无论是多模态还是Agent,LLM才是最重要的。这一年做了几个月的OMNI,实在感觉语音模态要达到文本模态这种理解力(LLM最重要的是理解而非生成能力)过于艰难,事倍功半,模态集成应该就是最好的出路,图像应该也类似。其实这也与人脑类似,耳朵和眼睛都是信号接收装备,真正处理信号的还得是大脑,而LLM就是AI系统的大脑。鉴于此,未来算法的主方向应该还是会考虑LLM,不过会把一半重心放在RL上,走LLM+RL的路线,这也是一个一直感兴趣的方向。
多模态的模态融合也是很好的方向,这里一定是“融合”,也就是如何在多模态中利用好LLM的能力。Pipeline级联模式当然是长期方案,但端到端、半端到端(类似Qwen-Audio)也在逐渐成熟。端到端模式在应用方面还是比较难,但作为研究方向会很有意思。
再就是Agent,这个方向总体是偏工程开发的,对于热爱写代码的程序员来说,应该可以作为长期方向坚持下去,具体方式可以是公司的业务服务,也可以是开源项目或软件。Agent的方向太简单没意思,比如RAG就实在是无趣得紧,但构建能自动完成复杂任务的Agent就非常有意思了,这里面甚至都不需要RAG,就是调用各种工具。其实关于怎么调用工具,除了前面提到的MCP,还有个完全基于图像的方法也挺有意思,比如Omniparser[12],它直接根据软件的图标进行选择使用。
这部分主要梳理对企业和个人来说如何使用AI。在开始之前,先列一下之前几次分享中提到的一些观点。
希望读者能从后面的分析中有所收获,即便没有也无需太过焦虑,时代洪流下,你即便往回游,最后也是向前走。
对于企业,可以总结三个方向:
对企业来说,重点是把AI“用”在产品或服务里面。自动化流程比较自然,因为对准的就是已有的业务,后面两个其实都是新的。当做提效工具可能是大部分企业最直接、简单的想法,但对企业来说,不应该只停留在让员工自己使用类似DeepSeek、Kimi这样的工具,或者自己在扣子上找需要的Agent。企业应该做的是把各种AI能力整合进来,统一对员工提供使用窗口。
整合各种能力对企业来说有很多好处。首先,这样做可以让所有员工比较方便地借助AI能力(方便使用),否则可能会两极化:喜欢主动学习的员工用得溜,不怎么关注新技术的员工完全不会用。有人说可以组织内部培训,的确如此,但这就得说第二个好处:降低使用门槛。AI相关的模型非常多,有的还不容易获取,让员工自己去探索,那大部分人可能只知道国内打广告比较多的几个,其他的就比较麻烦了。而且科学上网也会拦住一大堆人。第三,整合后可以统一优化,或动态选择不同能力的模型,从使用者的角度看就是效率更好、体验更好。最后,有个统一的使用窗口也能省掉员工的搜索、跟进、学习成本,公司整体效率更高。
整合能力可以是一个非常简单的聊天窗口界面,也可以针对自有业务进行优化改进。比如合同审核,是不是可以直接集成到已有系统,或者专门针对这类业务做一个页面。有些企业可能自己没有这样的开发能力,但相信很快市面上就会出现很多提供类似服务的供应商,只需采购相关服务即可。其实钉钉、飞书等平台早就已经在自己系统里集成了大量的AI功能。
最后是新业务、新应用和新产品。这个需要企业根据自己业务实际情况重新设计了。未来AI在企业中的使用应该会跟今天使用Word、Excel一样普遍和容易。AI会深入到企业每个业务方向,它将无处不在。
对于个人,也可以总结三个方向:
其实对个人来说,不用AI也没什么关系。当然,很多时候可能你已经用了而不自知,比如你下了豆包APP,和其中的Agent打了个语音电话,这其实也算是一种使用,而且还用了不止一种AI能力(LLM和语音)。上面提到的三个方向,每一个都有一些对应的APP,围绕着我们的工作、学习和生活。
学习和生活这里就不多说了,稍微说一下工作场景。其实每个部门都能找到使用AI的场景,比如人力资源的六大模块。
其他如市场运营、行政办公、财务资金、稽核法务、物流配送等部门也类似。总之,只要理解了三个方向,总能找到它的用武之地。其实对工作场景来说,有条件的话最好的还是企业统一提供相关工具(上一小节)。个人需要与时俱进,企业更应该如此才是。
本文从行业、职业和使用三个方面对AI(主要是LLM)近期的发展进行梳理讨论。主要是DeepSeek突然爆火后,好像所有企业、所有人都得用,不用就落伍了。R1之前好像也没这样。DeepSeek爆火是有原因的,但所有人都涌进来就有点奇怪了,很像股市火爆时大妈冲进去的样子,不知道这里面有多少人和企业是真心想拥抱AI的,又有多少是想冲一波浪跑路的。总之,AI势不可挡已成定式,无论如何,整个行业和生态的繁荣是真实的。对于从业人员来说,这就够了。
《Off Campus》第二季官宣:这对CP还在,但不再是主角
和平精英如何做到压枪稳-和平精英怎样才能压枪稳
币安Binance虚拟货币交易平台 币安官方APP安卓苹果下载入口
客单价碾压宝马奥迪!极氪5月交付新车34377辆:连续4个月双增长
HBO 奇幻剧《龙之家族》第三季定档 6 月 22 日,最终预告片曝光喉道海战
帅到极致的网名女生霸气(精选100个)
帅气继父网名女生可爱英文(精选100个)
DOTA2 TI时隔七年重返上海!门票6月10日开抢,国服享受优先购买!
如何在夸克浏览器中开启网页视频的倍速播放功能?
韦一敏是什么梗
蒙古上单是什么梗
韩漫小少爷网名大全女生(精选100个)
网络热词聊污是什么意思
欧易OKX官方网站直达入口 2026欧易官方App安卓版v7.1.0下载安装
抖音最火沙雕男生网名(精选100个)
作家助手如何上传自制封面 作家助手如何设置小说的封面
折后价近千元 澳洲一店主将真老鼠缝到内裤上当时尚单品卖
阿里发布Qwen3.7-Max大模型,全球第五、国产第一
金铲铲之战s17六暗星卡莎阵容玩法构筑指南
三角洲行动卡战备怎么弄 三角洲行动卡战备攻略
手机号码测吉凶
本站所有软件,都由网友上传,如有侵犯你的版权,请发邮件haolingcc@hotmail.com 联系删除。 版权所有 Copyright@2012-2013 haoling.cc