您的位置：首页 > > 教程攻略 > ai资讯 >给 Agent & RAG 方向创业者的论文、产品和心得整理

给 Agent & RAG 方向创业者的论文、产品和心得整理

来源:互联网 更新时间:2026-06-02 19:58

对于在 Agent 和 RAG 方向探索的创业者来说，搞清楚技术路线和落地场景，比追热点重要得多。行业里不乏优秀的开源项目和产品案例，它们背后往往有一系列核心论文作为理论支撑。我们花时间梳理了近年来这个方向最具代表性的研究成果、开源实践和产品落地经验，整理成了一份资料集供大家参考。

一、 Agent & RAG 精选论文

1. Agent 精选论文

先说推理和行动这条主线。基础层级的几篇论文几乎绕不开：

《Chain of Thought》

是关于推理场景下训练语料和prompt方法的奠基性工作，它告诉我们如何引导模型一步步思考。它的姊妹篇

《ReAct》

更进一步——让大语言模型先观察当前环境，思考之后再做行动，这为后来的Agent设计提供了基本范式。

在此基础上，

《Reflexion》

引入了一个非常有价值的机制——自我反思。模型不再是一次性输出，而是能对自己之前的行动进行评估和修正。

《Tree of Thought》

则探讨了在特定复杂场景下的Agent路径规划，它不是一条道走到黑，而是结构化的树状搜索。至于落地Demo，

《Voyager》

用LLM去玩《我的世界》，虽然场景特殊，但展示了长周期自主探索的能力。

《ToolLLM》

的视角更聚焦工具使用，它探索了通过微调（finetune）来提升模型调用工具的效果，而

《CogAgent》

则将Agent能力拓展到了手机屏幕控制这类更具体的UI交互场景。

2. RAG 相关精选论文

检索增强生成（RAG）方面的几篇工作各有侧重。

《InstructRetro》

提出了检索增强预训练后的指令调优，核心思路是让模型在预训练阶段就学会利用外部数据库，从而提高回答的准确性和降低困惑度。

《RA-DIT》

则是双指令调优的思路，目的是让语言模型更好地通过外部数据存储获取长尾或最新知识。如果想要一个全局视野，

《Retrieval-Augmented Generation for Large Language Models: A Survey》

这篇综述非常值得读，它系统梳理了RAG从技术发展到评估方法的关键路径，对于知识密集型任务而言，RAG的价值已经得到广泛验证。

3. Continual pretrain 精选论文

持续预训练能显著提升特定领域的能力。数学推理是一个典型的攻坚方向。

《DeepSeekMath》

通过在大规模数学相关语料（从Common Crawl中筛选）上继续训练DeepSeek-Coder-Base，让7B参数量的模型在数学推理上达到了惊人的效果。

《InternLM-Math》

则尝试了一种更统一的方案，将思维链、奖励模型、形式推理、数据增强和代码解释器整合到一个序列到序列的格式中，打造一个多功能的数学推理器。

《LLEMMA》

的路径也很有代表性，它基于Code Llama，在包含科学论文、数学网页和代码的混合数据集Proof-Pile-2上继续训练，进一步推进了开源数学模型的边界。

4. SFT 精选论文

指令微调（SFT）依然是提升模型通用能力的关键。

《Scaling Instruction-Finetuned Language Models》

这篇工作系统地验证了三个缩放维度的效果：任务数量、模型大小以及对思维链数据的微调。结论很清晰——这三个维度的提升能显著改善模型在PaLM、T5等多种模型架构上的表现，无论是零样本、少样本还是思维链场景。而

《MAmmoTH2》

提出了一种非常实用的方法，它从预训练的网页语料中高效挖掘了1000万条天然的指令数据，用于增强推理能力，这为低成本获取高质量训练数据提供了思路。

二、 Agent & RAG 开源项目

论文之外，开源项目是技术落地最直接的试金石。在Agent领域，

Auto-GPT

无疑是火爆的起点，它让LLM-based Agent的概念走进大众视野。而在多智能体协作方面，

Camel

提出了Role-Playing Chatting的设计范式，很有启发性。基于此，

ChatDev

和

MetaGPT

分别探索了在程序开发场景下的多Agent协作，前者偏重角色扮演，后者则强调结构化分工。

AutoGen

同样是微软推出的多Agent框架，它在角色扮演对话上做了很多工程优化。

TaskWea ver

则另辟蹊径，采用Code-first的思路，在数据处理这类结构化任务上表现不错。

XAgent

作为OpenBMB的另一个项目，目标是超越Auto-GPT的基准表现，解决更复杂的任务。

LangGraph

是LangChain团队在Agent领域的布局，侧重于用图结构来管理Agent的工作流。值得注意的是，TaskWea ver和XAgent都值得细看，它们在代码驱动和复杂任务落地方面各有侧重。

三、 Agent & RAG 产品案例

产品落地是最能检验技术价值的一环。

Puppy Agent（穆冠群）

聚焦企业内复杂场景，维护了一套Code-driven的Agent框架，让Agent无缝嵌入企业代码工作流。它的探索在于如何让“搜索+Agent”和“CRUD+Agent”在真实业务中跑通，而不是停留在Demo层面。

SmartPrep.AI & 智启学院（李文轩）

瞄准教育这一垂直领域。SmartPrep.AI 是全球首个大模型原生的教学管理平台，目标是把大模型变成教师的助教和学生的学伴，已经服务了多家国际教育组织。智启学院则是一个Agent驱动的新型教育机构，让6-15岁的孩子能够借助AI进行项目制学习——这个方向对课程设计和Agent的陪伴能力要求都很高。

Devv.ai（张佳圆）

是面向开发者的AI搜索引擎，底层技术结合了垂直领域的Search Index和RAG。产品上线数月就获得了近百万开发者用户，这说明在编程这种高频、高信息密度的场景下，精准检索加上RAG的增强模式是有效的。

交影科技（焦旸）

专注特种数据合成与增强。它通过关系抽取加实体抽取来构建增强数据集，再用启发器加验证器联动的方式生成合成数据集。这套流程在数理、工业、特种数据领域很有价值，因为这些场景通常缺乏标注好的专业数据集。

Bagel（刘荣轩）

做的是AI搜索引擎，但切入点很特别——先从微信生态做起，让用户用最简单的方式获取价值信息。它打出了“质量第一，有趣第二，省钱第三”的旗号，产品覆盖微信、飞书和网页端，试图把做调研这件事变得像吃早饭一样简单。

以上案例均来自奇绩校友，他们分别在不同的垂直场景中验证了Agent和RAG的商业化路径。在资料集中，我们也整理了他们在B端落地、建立产品壁垒以及应对RAG商业化痛点方面的详细心得，供大家一起讨论。

AI自动绘画大师

类型：益智休闲

大小：5.72MB

语言：简体中文

平台：互联网

游戏下载