关闭广告

ACL 2025:DeepSeek与北大团队获最佳论文

网易科技报道2025-07-31 12:00:015437人阅读

2025年7月27日至8月1日,第63届 (计算语言学年会)在奥地利维也纳举行。今年大会总投稿量突破8000篇,创历史新高,最终主会接收率为20.3%,Findings 接收率为16.7%。根据大会官方数据,中国作者首次在第一作者占比中过半,达到51.3%,远超第二名美国(14.0%)。

本届 ACL 共评选出4篇最佳论文。 与北耀东团队各摘得一项,另两项授予 CISPA&TCS Research&微软团队,以及斯坦福大学与 Cornell Tech 合作团队。

其中《Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention》由DeepSeek 团队与北京大学、华盛顿大学合作,梁文锋亲自挂名,论文提出稀疏注意力机制 NSA(Native Sparse Attention),显著提升长上下文训练与推理效率。该模型通过引入多路径注意力与硬件对齐优化,在保持精度的同时实现推理加速,验证了其在 A100 GPU 上的实际性能优越性。

北大团队则在论文《Language Models Resist Alignment: Evidence From Data Compression》中首次系统性提出“大模型抗拒对齐”机制,指出模型在微调阶段可能因预训练结构惯性发生“弹回”,挑战了现有对齐方法的有效性。论文由杨耀东团队主导,强调大模型安全与治理的深层风险,被大会主席评价为“为安全对齐问题提供坚实理论基础”。(袁宁)

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

全新前脸/三种座椅布局可选 第三代豪越L内外饰曝光

网易汽车 浏览 53 10-31

T恤+阔腿裤、背心+阔腿裤,今年夏天最火搭配,谁穿谁好看!

LinkFashion 浏览 5092 05-27

这9分神片终于引进,可惜票房不到100万

独立鱼 浏览 76 09-01

巴基斯坦确认给沙特核保护 印度回应

澎湃新闻 浏览 104 09-21

男童大理走失背后的研学乱象:有销售称可瞒报病史报名

红星新闻 浏览 2071 08-14

打入一球,库尼亚当选利兹联vs曼联全场最佳球员

懂球帝 浏览 13 01-05

女人过了40岁夏天要怎么穿衣?认准这些搭配方式,简约又高级

静儿时尚达人 浏览 7394 06-19

2026年国产上市 新世代BMW iX3慕尼黑车展发布

网易汽车 浏览 70 09-09

公募FOF重回景气

证券市场周刊 浏览 94 09-02

港交所:取消中国恒大上市地位

网易财经 浏览 9753 08-21

广汽丰田全新威兰达申报

大象新闻 浏览 6225 08-11

美贸易代表:新一轮关税“基本已定”

观察者网 浏览 7503 08-04

抖音:近一年优质内容播放时长为普通内容的17倍

封面新闻 浏览 101 09-22

伊朗情报部长:已掌握大量以色列核机密文件

凤凰卫视 浏览 1617 06-09

七七火了!于正抢人!网友:周迅与张柏芝的合体

TVB的四小花 浏览 3569 07-16

拜仁薪资排名:迪亚斯加盟后1400万欧位列第7,高于奥利塞

直播吧 浏览 8123 07-28

自研散热引擎+7000mAh冰川电池 OPPO发布K13 Turbo售价1999元起

网易科技报道 浏览 5916 07-22

满分发挥!美职联官方社媒称赞梅西表现:我们快词穷了

直播吧 浏览 4672 07-20

C罗再谈曼联:架构出错阿莫林无法创奇迹,为此难过希望尽快复兴

罗米的曼联博客 浏览 47 11-05

曝李金铭怀孕待产!直播账号已停更近半年,曾卷入知三当三风波

萌神木木 浏览 14 01-06

明星基金经理“翻车”,800亿规模申万菱信,该如何突围?

侃见财经 浏览 402 08-18
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除沪ICP备20017958号-3