关闭广告

ACL 2025:DeepSeek与北大团队获最佳论文

网易科技报道2025-07-31 12:00:015499人阅读

2025年7月27日至8月1日,第63届 (计算语言学年会)在奥地利维也纳举行。今年大会总投稿量突破8000篇,创历史新高,最终主会接收率为20.3%,Findings 接收率为16.7%。根据大会官方数据,中国作者首次在第一作者占比中过半,达到51.3%,远超第二名美国(14.0%)。

本届 ACL 共评选出4篇最佳论文。 与北耀东团队各摘得一项,另两项授予 CISPA&TCS Research&微软团队,以及斯坦福大学与 Cornell Tech 合作团队。

其中《Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention》由DeepSeek 团队与北京大学、华盛顿大学合作,梁文锋亲自挂名,论文提出稀疏注意力机制 NSA(Native Sparse Attention),显著提升长上下文训练与推理效率。该模型通过引入多路径注意力与硬件对齐优化,在保持精度的同时实现推理加速,验证了其在 A100 GPU 上的实际性能优越性。

北大团队则在论文《Language Models Resist Alignment: Evidence From Data Compression》中首次系统性提出“大模型抗拒对齐”机制,指出模型在微调阶段可能因预训练结构惯性发生“弹回”,挑战了现有对齐方法的有效性。论文由杨耀东团队主导,强调大模型安全与治理的深层风险,被大会主席评价为“为安全对齐问题提供坚实理论基础”。(袁宁)

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

牛弹琴:伊朗和美以停火又悬了 有三点实在太诡异

现代快报 浏览 34 04-09

看着像保时捷?宾利首款纯电动车谍照曝光

车质网 浏览 2447 07-23

汪林朋坠楼身亡:其3.72亿股居然智家股票已全被冻结

经济观察报 浏览 8789 07-29

拯救“衰老”,这么护肤才有效率!

时尚COSMO 浏览 44 12-21

机票“锁座”变相收费 10家航司被约谈

北京商报 浏览 125 11-27

"闪赎闪卖"一座万达广场 王健林也玩起"资本游戏"?

BT财经 浏览 94 12-11

波兰将重开与白俄边境口岸 已有超130列中欧班列滞留

界面新闻 浏览 194 09-24

营收增3成,股价却涨2倍,蜜雪冰城供应商一致魔芋遭爆炒,劲牌公司“赢麻了”

时代周报 浏览 146 08-30

负债亏损盈利:三家央企新能源谁更胜一筹?

汽车公社 浏览 86 12-05

以创业板定投助力“长钱长投” 天弘基金联合深交所举办ETF大讲堂活动

证券市场周刊 浏览 5596 07-22

专家:未来是不是进一步建设黄岩岛 取决于四个因素

澎湃新闻 浏览 195 09-24

20台空调外机安装在车库最高温逾50℃ 业主喊热抱怨

大风新闻 浏览 232 08-30

泰柬新一轮边境冲突持续一周 数十万人逃离家园

北青网-北京青年报 浏览 94 12-15

通辽舰、郴州舰赴南海某海域 开展实际使用武器训练

极目新闻 浏览 3315 08-06

时尚中国 荣耀东方——首届中国时尚产业盛典将亮相上海

时尚COSMO 浏览 2009 06-08

杨兰兰身份疑被扒 知情人:名字能猜出身份 叠字有讲究

火山诗话 浏览 4232 08-10

三季报,茅台失速!

YOUNG财经 浏览 124 11-03

阿斯:若巴萨不执行买断拉什福德的选项,将向曼联付一小笔违约金

直播吧 浏览 7837 07-21

阿维塔,准备好了

网易汽车 浏览 3880 08-01

搭载1.5T插混系统 探岳L PHEV申报图曝光

网易汽车 浏览 95 01-10

网友曝姚晨新欢是侯雯元!二人交集被扒

萌神木木 浏览 55 03-17
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除沪ICP备20017958号-3