热门搜索:和平精英 原神 街篮2 

您的位置:首页 > > 教程攻略 > ai资讯 >给 Agent & RAG 方向创业者的论文、产品和心得整理

给 Agent & RAG 方向创业者的论文、产品和心得整理

来源:互联网 更新时间:2026-06-02 19:58

对于在 Agent 和 RAG 方向探索的创业者来说,搞清楚技术路线和落地场景,比追热点重要得多。行业里不乏优秀的开源项目和产品案例,它们背后往往有一系列核心论文作为理论支撑。我们花时间梳理了近年来这个方向最具代表性的研究成果、开源实践和产品落地经验,整理成了一份资料集供大家参考。

一、 Agent & RAG 精选论文

1. Agent 精选论文

先说推理和行动这条主线。基础层级的几篇论文几乎绕不开:

《Chain of Thought》

是关于推理场景下训练语料和prompt方法的奠基性工作,它告诉我们如何引导模型一步步思考。它的姊妹篇

《ReAct》

更进一步——让大语言模型先观察当前环境,思考之后再做行动,这为后来的Agent设计提供了基本范式。

在此基础上,

《Reflexion》

引入了一个非常有价值的机制——自我反思。模型不再是一次性输出,而是能对自己之前的行动进行评估和修正。

《Tree of Thought》

则探讨了在特定复杂场景下的Agent路径规划,它不是一条道走到黑,而是结构化的树状搜索。至于落地Demo,

《Voyager》

用LLM去玩《我的世界》,虽然场景特殊,但展示了长周期自主探索的能力。

《ToolLLM》

的视角更聚焦工具使用,它探索了通过微调(finetune)来提升模型调用工具的效果,而

《CogAgent》

则将Agent能力拓展到了手机屏幕控制这类更具体的UI交互场景。

2. RAG 相关精选论文

检索增强生成(RAG)方面的几篇工作各有侧重。

《InstructRetro》

提出了检索增强预训练后的指令调优,核心思路是让模型在预训练阶段就学会利用外部数据库,从而提高回答的准确性和降低困惑度。

《RA-DIT》

则是双指令调优的思路,目的是让语言模型更好地通过外部数据存储获取长尾或最新知识。如果想要一个全局视野,

《Retrieval-Augmented Generation for Large Language Models: A Survey》

这篇综述非常值得读,它系统梳理了RAG从技术发展到评估方法的关键路径,对于知识密集型任务而言,RAG的价值已经得到广泛验证。

3. Continual pretrain 精选论文

持续预训练能显著提升特定领域的能力。数学推理是一个典型的攻坚方向。

《DeepSeekMath》

通过在大规模数学相关语料(从Common Crawl中筛选)上继续训练DeepSeek-Coder-Base,让7B参数量的模型在数学推理上达到了惊人的效果。

《InternLM-Math》

则尝试了一种更统一的方案,将思维链、奖励模型、形式推理、数据增强和代码解释器整合到一个序列到序列的格式中,打造一个多功能的数学推理器。

《LLEMMA》

的路径也很有代表性,它基于Code Llama,在包含科学论文、数学网页和代码的混合数据集Proof-Pile-2上继续训练,进一步推进了开源数学模型的边界。

4. SFT 精选论文

指令微调(SFT)依然是提升模型通用能力的关键。

《Scaling Instruction-Finetuned Language Models》

这篇工作系统地验证了三个缩放维度的效果:任务数量、模型大小以及对思维链数据的微调。结论很清晰——这三个维度的提升能显著改善模型在PaLM、T5等多种模型架构上的表现,无论是零样本、少样本还是思维链场景。而

《MAmmoTH2》

提出了一种非常实用的方法,它从预训练的网页语料中高效挖掘了1000万条天然的指令数据,用于增强推理能力,这为低成本获取高质量训练数据提供了思路。

二、 Agent & RAG 开源项目

论文之外,开源项目是技术落地最直接的试金石。在Agent领域,

Auto-GPT

无疑是火爆的起点,它让LLM-based Agent的概念走进大众视野。而在多智能体协作方面,

Camel

提出了Role-Playing Chatting的设计范式,很有启发性。基于此,

ChatDev

MetaGPT

分别探索了在程序开发场景下的多Agent协作,前者偏重角色扮演,后者则强调结构化分工。

AutoGen

同样是微软推出的多Agent框架,它在角色扮演对话上做了很多工程优化。

TaskWea ver

则另辟蹊径,采用Code-first的思路,在数据处理这类结构化任务上表现不错。

XAgent

作为OpenBMB的另一个项目,目标是超越Auto-GPT的基准表现,解决更复杂的任务。

LangGraph

是LangChain团队在Agent领域的布局,侧重于用图结构来管理Agent的工作流。值得注意的是,TaskWea ver和XAgent都值得细看,它们在代码驱动和复杂任务落地方面各有侧重。

三、 Agent & RAG 产品案例

产品落地是最能检验技术价值的一环。

Puppy Agent(穆冠群)

聚焦企业内复杂场景,维护了一套Code-driven的Agent框架,让Agent无缝嵌入企业代码工作流。它的探索在于如何让“搜索+Agent”和“CRUD+Agent”在真实业务中跑通,而不是停留在Demo层面。

SmartPrep.AI & 智启学院(李文轩)

瞄准教育这一垂直领域。SmartPrep.AI 是全球首个大模型原生的教学管理平台,目标是把大模型变成教师的助教和学生的学伴,已经服务了多家国际教育组织。智启学院则是一个Agent驱动的新型教育机构,让6-15岁的孩子能够借助AI进行项目制学习——这个方向对课程设计和Agent的陪伴能力要求都很高。

Devv.ai(张佳圆)

是面向开发者的AI搜索引擎,底层技术结合了垂直领域的Search Index和RAG。产品上线数月就获得了近百万开发者用户,这说明在编程这种高频、高信息密度的场景下,精准检索加上RAG的增强模式是有效的。

交影科技(焦旸)

专注特种数据合成与增强。它通过关系抽取加实体抽取来构建增强数据集,再用启发器加验证器联动的方式生成合成数据集。这套流程在数理、工业、特种数据领域很有价值,因为这些场景通常缺乏标注好的专业数据集。

Bagel(刘荣轩)

做的是AI搜索引擎,但切入点很特别——先从微信生态做起,让用户用最简单的方式获取价值信息。它打出了“质量第一,有趣第二,省钱第三”的旗号,产品覆盖微信、飞书和网页端,试图把做调研这件事变得像吃早饭一样简单。

以上案例均来自奇绩校友,他们分别在不同的垂直场景中验证了Agent和RAG的商业化路径。在资料集中,我们也整理了他们在B端落地、建立产品壁垒以及应对RAG商业化痛点方面的详细心得,供大家一起讨论。

AI自动绘画大师
AI自动绘画大师

类型:益智休闲

大小:5.72MB

语言:简体中文

平台:互联网

游戏下载

热门手游

手机号码测吉凶
本站所有软件,都由网友上传,如有侵犯你的版权,请发邮件haolingcc@hotmail.com 联系删除。 版权所有 Copyright@2012-2013 haoling.cc