关闭广告

小语种恐被AI时代边缘化?多国专家呼吁:语言模型不能只服务大语种!

第一财经资讯2025-07-29 12:00:017438人阅读

“巴别鱼”是英国作家道格拉斯·亚当斯在1979年出版的科幻小说《银河系漫游指南》中创造的虚构生物——这种外形呈黄色水蛭状、寄生在宿主耳道内的神奇生物能够突破语言障碍,实现跨物种的语言交流。

翻译机的出现已经打破了人类语言的隔阂,让人们能够自由交流。然而进入AI时代,由于大部分的通用大模型对低资源语言的支持严重不足,使得小语种国家仍面临被时代边缘化的风险。

在今年的上海世界人工智能大会(WAIC)的一场高级别高水平多语言基座大模型国际学术研讨会上,来自近20个国家的约30位语言专家和人工智能专家就如何弥合AI语言模型的鸿沟,实现普惠AI技术进行深入探讨。

专家认为,如果语言被技术遗忘,那么使用这个语言的群体也会被时代遗忘;而只有当小语种国家的孩子也能够用自己的母语向AI提问时,AI平权才真正实现了。

塞尔维亚语是流行在东欧巴尔干半岛前南斯拉夫诸国的一种语言。然而,该语言的使用率远低于同一地区的斯洛文尼亚语。塞尔维亚诺维萨德大学技术科学学院主任Vlado Delić教授指出,塞尔维亚语在通用模型中token占比不足0.1%!

“语言模型不能只服务大语种,每种语言都应拥有体现其文化身份的大模型。”Delić表示。他还称,这对于人工智能在医疗、法律等关键领域的普及非常重要,必须构建符合本国语言特点和文化语境的国家级大模型。

匈牙利语具有极度复杂的词缀组合及自由语序,这为大语言模型token的划分等带来独特挑战。对此,匈牙利语言学研究中心总干事Gábor Prószéky教授强调,数据质量优于数据体量,是构建可信大语言模型的关键。他希望能与中国AI同行合作,构建语言模型的评估框架,实现从训练、语料建设到实际应用的完整闭环。

以色列人类语言技术协会(IAHLT)创始人兼董事Avner Algom以希伯来语为例称,希伯来语虽是世界上唯一被成功复兴为现代口语的古老语言,但在自然语言处理领域仍属低资源语言。


Algom强调:“语言服务不能只为大语种设计,小语种也应拥有技术平权。”IAHLT基于开源模型,已训练出双语大模型(希伯来语+英语),并部署于教育、客服、医疗等场景。通过政府财政激励机制,联合产业界解决数据获取合法性、训练成本和落地门槛问题。

科大讯飞研究院院长刘聪在研讨会上表示,科大讯飞最新升级的星火大模型X1已经可以支持超过130语种,希望与来自全球的机构合作,构建全方位的多语言大模型和应用,为世界提供“中国方案”,破解全球多语言大模型技术难题。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

对话零跑汽车朱江明:从“半价Model 3”到如何给年轻人情绪价值

车东西 浏览 5295 07-30

燃油车的“智能”反击!2025广州车展燃油新车盘点

车市红点 浏览 93 11-25

疯狂推新,营收大涨27%!小熊电器“翻身”

侃见财经 浏览 124 10-16

关键文件出台,这次国家真急了!

米筐投资 浏览 8172 07-26

弗里克:相信阿隆索会有新工作;坎塞洛明天有可能上

懂球帝 浏览 77 01-15

ESPN:太阳10个月内5次被员工起诉 有员工称患癌后被球队阻挠休假

直播吧 浏览 4885 07-29

史诗级外卖大战,究竟谁亏麻了,谁赚钱了?

每日人物 浏览 9450 07-26

鸿蒙智行 2025 年 9 月全系交付新车 52916 台

IT之家 浏览 83 10-02

柬埔寨内政部:柬泰冲突已致31名柬平民死亡

国际在线 浏览 35 12-27

新款奥迪Q5L实车曝光,轴距增加,黑科技加持

大李说车 浏览 1218 06-26

特瓦斯:大多数联赛都在苦苦挣扎,我好奇为何人们这么想阻止海外赛

懂球帝 浏览 56 10-23

大学教授教100个老人用大模型,让AI了解他们真正的困境

每日人物 浏览 110 11-10

斯洛特:尽管我们取得四连胜,但球队的表现并不完美

懂球帝 浏览 79 01-02

2026款零跑C16 预售价16.98万起

每日侃车 浏览 5661 06-16

联大反击或剥夺美国重要资格 美恐难再与中同台论道

策略述 浏览 83 01-11

蓉城晋级足协杯半决赛!韦世豪双响,4战海牛全胜

奥拜尔 浏览 1769 07-24

以部长:已接回人质 必须重启战争打开加沙"地狱之门"

看看新闻Knews 浏览 56 10-22

小米汽车 8 月限时购车权益更新,SU7 及 Ultra 部分配置下架

IT之家 浏览 4175 07-25

泰柬在13条战线上交战 泰总理:愿意接听特朗普电话

环球网资讯 浏览 80 12-12

狂揽70亿挑战DeepSeek!AI创企被曝新融资,被英伟达押宝,团队大牛云集

智东西 浏览 5762 08-06

美国老旧电网难以支撑数据中心快速扩张,科技巨头被迫自建电厂

IT之家 浏览 3605 08-18
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除沪ICP备20017958号-3