关闭广告

ACL 2025:DeepSeek与北大团队获最佳论文

网易科技报道2025-07-31 12:00:015354人阅读

2025年7月27日至8月1日,第63届 (计算语言学年会)在奥地利维也纳举行。今年大会总投稿量突破8000篇,创历史新高,最终主会接收率为20.3%,Findings 接收率为16.7%。根据大会官方数据,中国作者首次在第一作者占比中过半,达到51.3%,远超第二名美国(14.0%)。

本届 ACL 共评选出4篇最佳论文。 与北耀东团队各摘得一项,另两项授予 CISPA&TCS Research&微软团队,以及斯坦福大学与 Cornell Tech 合作团队。

其中《Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention》由DeepSeek 团队与北京大学、华盛顿大学合作,梁文锋亲自挂名,论文提出稀疏注意力机制 NSA(Native Sparse Attention),显著提升长上下文训练与推理效率。该模型通过引入多路径注意力与硬件对齐优化,在保持精度的同时实现推理加速,验证了其在 A100 GPU 上的实际性能优越性。

北大团队则在论文《Language Models Resist Alignment: Evidence From Data Compression》中首次系统性提出“大模型抗拒对齐”机制,指出模型在微调阶段可能因预训练结构惯性发生“弹回”,挑战了现有对齐方法的有效性。论文由杨耀东团队主导,强调大模型安全与治理的深层风险,被大会主席评价为“为安全对齐问题提供坚实理论基础”。(袁宁)

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

日产汽车2000亿日元巨亏背后:断臂求生的电动化救赎

道哥说车 浏览 5794 06-26

大鹏白客新剧同台飙戏!一个曾血本无归,一个因社保出道,太真实

娱乐白名单 浏览 946 07-30

联想加速中东地区战略扩张 在沙特设立区域总部

网易科技报道 浏览 8623 08-19

李小璐二胎风波升级!蛛丝马迹被扒?

头号剧委会 浏览 2561 07-09

吴孟达去世才4年,50年老友王晶抖落其不堪

墨羽怪谈 浏览 2099 07-26

滴滴跑出了什么新故事?

虎嗅APP 浏览 12 09-01

坐拥北京60亩马场的于谦,私下到底有多壕

叨叨话影 浏览 7722 08-16

格拉利什:在曼城的4年很美好,今年夏天我决定做出改变

懂球帝 浏览 17 08-25

美要"路线图"俄提"新想法" 俄美外长会谈细节披露

新华社 浏览 5513 07-11

上海"器官农场"晒成果 培育出世界最大"生物人工心脏"

新民晚报 浏览 6312 08-12

智能眼镜领头羊,道出行业泡沫

虎嗅APP 浏览 5578 07-26

普京确定俄乌谈判俄方代表团名单

央视新闻客户端 浏览 1187 05-15

中国新能源车产地之争其实是广东、安徽和北京之争?

BT财经 浏览 4529 07-22

郑钦文缺席、大威复出,北美硬地赛季正式开启!

网球之家 浏览 8504 07-22

前五角大楼顾问警告:美国导弹库存告急

环球网资讯 浏览 4851 07-19

传闻中的最大单!优必选中标近1亿人形机器人采购订单

网易科技报道 浏览 969 07-22

记者:塞斯科是纽卡锋线引援首选,备选中有巴黎球员拉莫斯

直播吧 浏览 8890 08-04

图片报:多特有意鲍勃等球员,但英超球队越来越不愿意卖人给他们

直播吧 浏览 8544 07-22

17年匆匆08年内马尔&库鸟新星对决,25年成母队队长再次相遇

直播吧 浏览 5675 08-19

俄唯一现役航母面临两个解决方案:要么出售要么报废

看看新闻Knews 浏览 6147 07-27

米体:罗马有意埃吉纳尔多&速度达37.5公里/小时,矿工要1500万欧

直播吧 浏览 8601 08-09
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除沪ICP备20017958号-3