关闭广告

ACL 2025:DeepSeek与北大团队获最佳论文

网易科技报道2025-07-31 12:00:015388人阅读

2025年7月27日至8月1日,第63届 (计算语言学年会)在奥地利维也纳举行。今年大会总投稿量突破8000篇,创历史新高,最终主会接收率为20.3%,Findings 接收率为16.7%。根据大会官方数据,中国作者首次在第一作者占比中过半,达到51.3%,远超第二名美国(14.0%)。

本届 ACL 共评选出4篇最佳论文。 与北耀东团队各摘得一项,另两项授予 CISPA&TCS Research&微软团队,以及斯坦福大学与 Cornell Tech 合作团队。

其中《Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention》由DeepSeek 团队与北京大学、华盛顿大学合作,梁文锋亲自挂名,论文提出稀疏注意力机制 NSA(Native Sparse Attention),显著提升长上下文训练与推理效率。该模型通过引入多路径注意力与硬件对齐优化,在保持精度的同时实现推理加速,验证了其在 A100 GPU 上的实际性能优越性。

北大团队则在论文《Language Models Resist Alignment: Evidence From Data Compression》中首次系统性提出“大模型抗拒对齐”机制,指出模型在微调阶段可能因预训练结构惯性发生“弹回”,挑战了现有对齐方法的有效性。论文由杨耀东团队主导,强调大模型安全与治理的深层风险,被大会主席评价为“为安全对齐问题提供坚实理论基础”。(袁宁)

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

以伊冲突:伊朗610人死亡 以色列28人死亡

新京报 浏览 8283 06-26

记者:A-希门尼斯因迟到被米兰清洗,囧叔对带坏风气的人毫不手软

直播吧 浏览 27 09-26

男子称被人侵占4600万 案件却被两次退侦并最终撤案

大风新闻 浏览 7238 07-26

鲁杰里:与格列兹曼小蜘蛛并肩作战很激动 西蒙尼是世界级教练

直播吧 浏览 9052 07-21

马卡:因辩方要求评估法官回避情况,马拉多纳死亡案预审暂停

懂球帝 浏览 5173 07-19

中国父子在德国冰雪融水湖溺亡 4岁女儿目睹悲剧发生

潇湘晨报 浏览 8659 07-16

32岁杨紫又“变脸”,皮肤紧致一脸高原红,重回“锦觅”颜值巅峰

温柔娱公子 浏览 15 09-29

阿斯:16岁摩洛哥新星未能通过皇马的体检,可能重返阿贾克斯效力

直播吧 浏览 8218 07-19

英特尔前中国区总裁加入AMD:曾被冠以“AMD杀手”之名!

快科技 浏览 8423 07-28

越南前国家领导人阮春福、武文赏等3人被解除党内职务

央视新闻客户端 浏览 6181 07-20

上海W盛典晚宴,杨幂靠边坐,马伊琍脸肿又黑,C位被1200万人围观

可乐谈情感 浏览 60 08-22

美媒:美挥关税大棒 在为自身的孤立和边缘化埋下种子

上观新闻 浏览 3983 08-06

普京与美特使会晤:俄愿无先决条件与乌谈判

央视新闻客户端 浏览 5734 04-27

解放军位黄岩岛领海领空及周边区域组织战备警巡

界面新闻 浏览 401 06-01

宗馥莉将独立经营“娃小宗” 名下仍关联超200家企业

21世纪经济报道 浏览 16 10-11

生猪大扩张即将告一段落?控产政策频出,产能去化或仍需时日

猛犸资本局 浏览 9067 07-26

OPPO Find X9 手机核心规格公布:6.78 英寸 1.5K OLED 直屏

IT之家 浏览 27 09-29

特朗普向米莱表态:若你们与中国军方合作 我很不高兴

环球网资讯 浏览 18 10-16

捡来的便宜!翻垃圾找到6TB SSD:六块1TB的三星850 Pro

快科技 浏览 49 08-25

OpenAI被曝测试“gpt-5-reasoning-alpha-2025-07-13”新模型

IT之家 浏览 1224 07-20

女篮无缘亚洲杯决赛 韩旭泪洒发布会

篮球资讯达人 浏览 4826 07-20
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除沪ICP备20017958号-3