您的位置：首页 > > 教程攻略 > ai资讯 >超 Claude Mythos 5 成绩：OpenAI 最强“抓虫 AI”GPT-5.5-Cyber 刷新 CyberGym 纪录

超 Claude Mythos 5 成绩：OpenAI 最强“抓虫 AI”GPT-5.5-Cyber 刷新 CyberGym 纪录

来源:互联网 更新时间:2026-06-24 12:34

6月23日，OpenAI正式宣布扩展其Daybreak网络安全项目，并向安全防御团队开放完整版GPT-5.5-Cyber——一个专门为网络安全场景打造的专用模型。这意味着，在AI辅助漏洞发现这条赛道上，OpenAI正在把能力再往前推一步。超Claude Mythos 5成绩：OpenAI最强

这里需要先说明一下背景：Daybreak是OpenAI自家的网络安全计划，类似于Anthropic的Project Glasswing，核心目标就是帮助防御团队更快地发现、验证和修复漏洞，缩短从漏洞被披露到进入生产环境之间的“窗口期”。说白了，就是在黑客动手之前，把漏洞提前封死。但OpenAI在博文中也坦诚了一个现状：如今AI模型确实大大加快了漏洞发现的速度，可整个行业的痛点已经从“找漏洞”转移到“修漏洞”上——评估影响、写修复代码、测试、发布补丁，这一整套流程依然耗时费力。换句话说，AI把漏网之鱼捞上来了，但后续的收网工作还卡在流程里。那这款GPT-5.5-Cyber到底有多强？几个关键测试数据可以说明一切。在CyberGym（网络安全评测集）的单模型测试中，GPT-5.5-Cyber拿下了**85.6%**的最高分，直接刷新了GPT系列模型的纪录。作为对比，普通的GPT-5.5得分是81.8%，而Anthropic的Claude Mythos 5得分是83.8%。**差距虽不大，但在这个领域，每提升一个百分点都意味着实际攻防能力的质变。** 更让人关注的是ExploitGym测试——这个测试考验的是智能体能否把已知漏洞转化为可执行的攻击代码。GPT-5.5-Cyber的得分是**39.5%**，而普通GPT-5.5只有**25.95%**。提升幅度超过50%，这说明专有模型在“从理论到实战”这一步上远远领先。另外在SEC-bench Pro测试中——用于评估智能体在复杂软件目标上的长期漏洞发现能力和概念验证生成能力——GPT-5.5-Cyber得分**69.8%**，GPT-5.5为63.1%。同样，专有模型优势明显。从这些数据能看出一个清晰的趋势：通用大模型在安全领域的表现已经够好，但针对特定场景微调过的“专用”模型，才是真正拉开差距的关键。GPT-5.5-Cyber不仅刷新了纪录，更证明了定向训练的价值——这或许正是未来AI安全工具的发展方向。

超 Claude Mythos 5 成绩：OpenAI 最强“抓虫 AI”GPT-5.5-Cyber 刷新 CyberGym 纪录

热门资讯

热门手游

相关攻略

热门专题