您的位置:首页 > > 教程攻略 > ai资讯 >SenseNova 6.7 Flash-Lite - 商汤推出的多模态智能体模型
SenseNova 6.7 Flash-Lite - 商汤推出的多模态智能体模型
来源:互联网
更新时间:2026-06-13 14:56
SenseNova 6.7 Flash-Lite是什么
在AI模型追求更大、更强的趋势下,商汤科技反其道而行,推出了SenseNova 6.7 Flash-Lite。这并非一次简单的参数精简,而是一款专为真实世界工作流设计的轻量化多模态智能体模型。它的核心在于“原生多模态”架构,能够直接“看懂”复杂的网页布局、文档结构乃至财务图表,实现了从“看到”到“想到”再到“做到”的一体化闭环。更直观地说,在处理信息搜索这类任务时,它的Token消耗相比纯文本智能体直接降低了60%,同时在多项权威基准测试中达到了同级别的最优水平。
SenseNova 6.7 Flash-Lite的主要功能
- :模型能直接解析网页、文档和图表中的视觉信息,无需经过“视觉转文本”这一中间步骤,避免了信息在转换过程中的损耗。
- :它擅长处理需要多步骤协作的复杂任务,例如从原始数据出发,完成分析、调研,最终生成一份结构完整的PPT报告,实现端到端的交付。
- :原生集成了商汤的SenseNova-Skills体系,这意味着它可以无缝调用信息图生成、PPT创作、Excel分析等一系列办公场景下的专用技能。
- :得益于去掉了视觉转译层,在信息搜索等典型场景中,其Token消耗可比纯文本智能体降低高达60%,直接带来成本效益的提升。
- :虽然参数量更轻,但推理速度极快,能够满足高频、高并发的互动式生产环境需求。
SenseNova 6.7 Flash-Lite的技术原理
- :技术上的关键突破在于摒弃了传统的“语言模型+视觉模块”简单拼接模式。其视觉模块深度参与到核心决策与推理循环中,而不仅仅是作为文本的补充说明。
- :模型设计之初就瞄准了完整的工作流,能够自动化执行从数据处理、分析、可视化,到形成结论和提出建议的全链路任务。
- :面对深度调研等复杂场景,模型具备自主检索、对比多源数据的能力,并能从中准确提取关键逻辑,最终生成可视化的交付成果。
如何使用SenseNova 6.7 Flash-Lite
- :首先需要进入商汤的日日新大模型平台官网进行注册,并申请相应的Token Plan。
- :新用户可领取每5小时1500次调用的免费API配额,并创建自己的API Key。
- :通过官方提供的GitHub仓库,可以一键部署Hermes Agent或OpenClaw框架,并集成全套Skills插件,实现快速上手。
- :如果希望使用其他Agent框架,也可以从开源仓库中单独获取所需的SenseNova-Skills组件进行集成。
- :完成上述步骤后,即可通过API或集成的Agent框架接入模型,开始执行数据分析、PPT生成等具体任务。
SenseNova 6.7 Flash-Lite的关键信息和使用要求
- :商汤日日新 SenseNova 6.7 Flash-Lite
- :商汤科技(SenseTime)
- :轻量化原生多模态智能体模型
- :网页/文档/图表直接解析、长链路任务闭环、毫秒级响应
- :Token Plan首月为每模型提供每5小时1500次的调用额度
- :相关技能(SenseNova-Skills)和一站式部署包(Agent Pack)均在GitHub开源
- :官方主要支持Hermes Agent和OpenClaw框架
SenseNova 6.7 Flash-Lite的核心优势
- :Token消耗的显著下降意味着在同等成本下,可以完成更多的工作量,产出效率更高。
- :视觉信息直接参与推理,避免了传统方式中“转译-理解”两步走带来的信息偏差和丢失。
- :毫秒级的响应速度使其能够真正融入高频、实时的办公自动化流程,而非仅用于演示。
- :结合免费的初始额度和完全开源的工具链,用户几乎可以零成本快速验证并接入实际业务。
SenseNova 6.7 Flash-Lite的项目地址
- :可在商汤日日新平台查看模型详情。
- :模型及相关组件的代码与资源已在GitHub开源。
SenseNova 6.7 Flash-Lite的同类竞品对比
| 对比维度 |
SenseNova 6.7 Flash-Lite |
GLM-5 |
GPT-5.4 |
| 架构设计 |
原生多模态,视觉直参推理 |
传统多模态拼接 |
传统多模态拼接 |
| Token成本 |
信息搜索场景降低60% |
标准消耗 |
标准消耗 |
| 智能体能力(PinchBench) |
92分 |
85.3分 |
90.5分 |
| PPT生成(NovaPPTBench) |
90.7分 |
87分 |
87.6分 |
| 数学推理(MathVision) |
85.5分 |
72.1分 |
84.2分 |
| 办公技能生态 |
SenseNova-Skills全开源 |
部分开源 |
闭源 |
| 免费额度 |
每5小时1500次 |
有限免费/付费 |
有限免费/付费 |
SenseNova 6.7 Flash-Lite的应用场景
- :自动处理海量的销售数据或财务报表,快速生成包含洞察和可视化图表的运营分析报告,为决策提供支持。
- :能够自主编排任务,完成从信息搜集、数据对比到章节撰写的完整行业研究报告,并自动生成配套的数据图表。
- :覆盖PPT、信息图、Excel分析等高频率办公需求,实现一键式内容生成与美化,提升日常工作效率。
- :为老年人、青少年等需要更直观指引的群体,生成图文并茂、步骤清晰的办事流程或健康就诊指南。