来源:互联网 更新时间:2025-11-01 14:24
10月30日,凤凰智媒与香港中文大学宣布推出全球首个专为粤语而设的动态评测平台及生态系统CLEVA-Cantonese。凤凰卫视旗下人工智能数据服务机构——凤凰智媒为其提供了第一批高质量粤语数据。这个创新平台通过提供公平、动态且具参考价值的基准评估,揭示各类大语言模型对粤语的支持程度,并为研究人员及开发者提供具参考价值的分析,加速粤语大语言模型的优化及实际应用。
此前,港中大语言与视觉实验室研发的CLEVA(Chinese Language Models EVAluation Platform)是目前公认规模最大、涵盖最全面的中文大语言模型评估基准之一。CLEVA-Cantonese在此基础上,建立全球首个持续演进的粤语大语言模型评估生态系统。发布会上港中大计算机科学与工程学系助理教授、语言与视觉实验室负责人及CLEVA项目负责人王历伟教授介绍:此次系统平台整合了一个协作式的自动化工作流程,涵盖四个关键阶段:数据导入和筛选、语言模型理解、评估与反馈。这个持续循环的流程能实时提供洞见、推动模型创新、提升对粤语社群的服务质量,并产出可帮助其他低资源语言评测的研究成果。
粤语是香港、广东及海外华人生活地区的重要语言,但由于粤语语音语义的繁复多样、口语和文字的巨大差异、以及独特的文化背景等原因造成大模型对粤语的理解和支持能力较为欠缺。同时,粤语是低资源语言,语料库有限,所以收集更多高质量的数据,是提升大模型能力的基础条件。凤凰智媒一直致力于挖掘凤凰卫视多年积累的媒体数据资源价值,并且已经发布了一批具有香港地域特点和国际多元文化传播价值的高质量华语数据集。此次凤凰智媒发挥凤凰传媒行业对于语言理解能力和丰富多样的及时语料数据的优势,整理了各类场景具有特色的本港粤语口语数据,并进过人工标注、校验后参与投入了此评测平台的构建科研工作。随着评测平台的不断迭代和落地应用的普及,未来将在引导粤语环境下的研发与产品规划,助力粤语在教育、医疗、公共服务及文化生活等方面提供安全可信的模型,也将依托人工智能大模型的应用为粤语文化的传播起到积极帮助。
cf手游AWM
安徽师范大学给学生发150元过节费 学生:感觉被狠狠宠爱了
王者荣耀排位系统优化来袭
抖音如何发视频才有收益?如何靠播放量在抖音赚取收益?
抖音强制休息中怎么解除?强制休息中解除会封号吗?
今日小鸡庄园答案2025.10.1
蚂蚁庄园每日答题答案2025年10月1日
回合制RPG《时空之缕》TGS2025预告发布
《京麦》上架商品方法
鸣潮釉瑚有什么技能
第五人格新版本跛脚羊
抖音发视频怎么定时?定时发布有用吗?
归龙潮头衔有哪些
归龙潮长命锁涂鸦在什么地方
原神龙与山任务怎么做
抖音爆款怎么打造产品?爆款打造产品是什么?
抖音话题热榜在哪里看?吸引人的话题有哪些?
百家号怎么设置密码登录?百家号是什么样的平台?
西贝称用X光为冷冻大黄鱼去刺 会有辐射残留吗
抖音发布视频没有流量了要怎么弄?它的推流机制是什么?
手机号码测吉凶
本站所有软件,都由网友上传,如有侵犯你的版权,请发邮件haolingcc@hotmail.com 联系删除。 版权所有 Copyright@2012-2013 haoling.cc