来源:互联网 更新时间:2026-04-09 12:50
近日,Krafton 公司宣布推出旗下全新人工智能(AI)模型品牌“Raon”,标志着其在人工智能(AI)领域的深入布局,旨在助力研究者与开发者自由创新。此次发布也进一步彰显了Krafton以技术驱动构建AI生态的战略图景。
“Raon”这一名称灵感源自韩语中的“喜悦”(??)一词,体现了 Krafton 致力于通过 AI 技术创造游戏内在乐趣的理念。本次发布的模型品牌展现了 Krafton在基础模型开发上全流程技术能力——从数据收集、模型训练到性能评估,皆可独立完成。未来,公司计划进一步围绕 “Raon” AI 模型品牌加强其全球 AI 技术竞争力。
Kraton 同时还宣布在全球最大 AI 模型平台 Hugging Face 上同步开源四款模型,包括语音驱动大型语言模型(LLM) Raon-Speech、实时双向语音对话模型 Raon-SpeechChat、文本转语音(TTS)模型 Raon-OpenTTS 和视觉编码器 Raon-VisionEncoder。
Raon-Speech 是一款具备语音理解与生成能力的语音语言模型,参数规模为 90 亿(9B)。据 Krafton 介绍,在涵盖语音转文本、文本转语音、基于语音的问答等 7 项核心任务和 40 项基准测试的综合评估中,该模型在参数规模小于 100 亿的开源语音语言模型中,其英语与韩语性能均位列全球第一。
Raon-SpeechChat 是一款采用实时双向通信技术的语音语言模型,允许用户在与模型对话的过程中自由打断对方。它是韩国首款发布的实时双向语音模型。在 3 种双向通信模型评估基准中,它在反语音、插词处理和响应延迟等 13 个主要任务中的平均排名,都达到世界领先水平。
Raon-OpenTTS 是一个仅使用公共语音数据训练的文本转语音模型,而这些公共语音数据此前很难被直接使用。在一项对比模型语音与人类语音自然性的盲测中,其所展现的领先性能水平,不亚于使用私人数据训练的 TTS 模型。
Raon-VisionEncoder 是一款视觉编码器,能够将图像转换为 AI 能够理解的信息。当视觉编码器与语言模型结合时,视觉信息可以被处理,并且可以从零开始自我训练,无需使用任何预训练模型。在某些视觉识别任务中,它记录的结果超过了业内同类型旗舰级视觉编码器模型。在其他任务中,它的性能甚至超过了相关旗舰级模型 90% 以上,证明了其强有力竞争力。
Krafton 首席 AI 官(CAIO)Kangwook Lee 表示:“Raon 模型系列的发布是 Krafton AI 技术能力积累过程中的重要里程碑。我们期待将大规模训练数据和核心模型开源分享,让研究人员和开发者自由使用,助力多模态技术的发展以及韩国 AI 生态系统的发展。”
未来 Krafton 将持续推动 AI 模型和智能体技术的发展,引领技术创新。
《洛克王国 世界》开服必看 抢先入手16只完美精灵 开局就赢在起跑线
洛克王国世界翼王技能怎么配置
儿子去世 名下房产被判全归养母:生母缺席成长 养母照顾长大
洛克王国世界可丽希亚任务完成攻略
起猛了 在成都看到关公开公交:三国寻梦线巴士正式推出
洛克王国世界雪影娃娃捕捉攻略
洛克王国世界伊利斯怎么打
于东来回应退休:只是表面退休了 实际还是不退
能穿地的 “Wi-Fi” 无线网络成功了!可深入地表下100米 有望集成到手机中
最强斗王每周活动安排
张雪峰追悼会将在明日举行 生前曾有三次自救机会 都被他错过了
洛克王国世界精灵王
洛克王国世界迪莫怎么获得
“当对方说谢谢时,这样回,笑趴他”
守塔不能停官网首页入口
洛克王国世界可可果商店兑换哪些
免费追剧App推荐
女子遇起火拿毛巾捂口鼻:退房被收钱
三国冰河时代征服2赛季阵容推荐攻略
蚂蚁庄园今日答案3月10日(今日已更新)
手机号码测吉凶
本站所有软件,都由网友上传,如有侵犯你的版权,请发邮件haolingcc@hotmail.com 联系删除。 版权所有 Copyright@2012-2013 haoling.cc