关闭广告

ACL 2025:DeepSeek与北大团队获最佳论文

网易科技报道2025-07-31 12:00:015438人阅读

2025年7月27日至8月1日,第63届 (计算语言学年会)在奥地利维也纳举行。今年大会总投稿量突破8000篇,创历史新高,最终主会接收率为20.3%,Findings 接收率为16.7%。根据大会官方数据,中国作者首次在第一作者占比中过半,达到51.3%,远超第二名美国(14.0%)。

本届 ACL 共评选出4篇最佳论文。 与北耀东团队各摘得一项,另两项授予 CISPA&TCS Research&微软团队,以及斯坦福大学与 Cornell Tech 合作团队。

其中《Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention》由DeepSeek 团队与北京大学、华盛顿大学合作,梁文锋亲自挂名,论文提出稀疏注意力机制 NSA(Native Sparse Attention),显著提升长上下文训练与推理效率。该模型通过引入多路径注意力与硬件对齐优化,在保持精度的同时实现推理加速,验证了其在 A100 GPU 上的实际性能优越性。

北大团队则在论文《Language Models Resist Alignment: Evidence From Data Compression》中首次系统性提出“大模型抗拒对齐”机制,指出模型在微调阶段可能因预训练结构惯性发生“弹回”,挑战了现有对齐方法的有效性。论文由杨耀东团队主导,强调大模型安全与治理的深层风险,被大会主席评价为“为安全对齐问题提供坚实理论基础”。(袁宁)

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

伊姐周六热推:电视剧《余生有涯》;电视剧《猎豹》......

伊周潮流 浏览 52 10-19

奥尔特曼警告:把ChatGPT当作心理治疗师并不安全

IT之家 浏览 5124 07-26

他是著名演员,临终前也没听到儿子喊声爸?

妙知 浏览 54 10-17

全球第一爆剧,可惜还是烂尾了

独立鱼 浏览 1564 07-07

哈马斯称将把加沙地带行政控制权移交临时委员会

环球网资讯 浏览 47 10-27

美国升级行动逼迫马杜罗 多国声援委内瑞拉

环球网资讯 浏览 26 12-13

暑期档剧综大战:修仙、打拐、姐弟恋……

仙女事件簿 浏览 1112 07-30

霍尔:我相信埃弗顿的未来非常光明 莫耶斯是足坛传奇主帅

直播吧 浏览 2272 08-07

中国最友好邻国"倒向"美国 年初现端倪幸好中方有筹谋

博览历史 浏览 1889 08-05

7205家途虎“包围县城”

国际金融报 浏览 74 08-25

阚清子的“幸福肥”,炸翻了多少身材焦虑?

传递满满正能量 浏览 652 07-25

天价索赔后,欣旺达还能稳当“老六”吗?

财经无忌 浏览 5 01-27

今年夏天一定要有这件衣服,好看又复古!

LinkFashion 浏览 856 07-26

北京越野BJ40增程大电池版实车图曝光

车质网 浏览 26 12-22

三星被曝2026年发新款折叠屏手机,屏幕超7英寸、护照式设计,叫板苹果

智东西 浏览 27 12-24

“摩尔线程”能否成为中国的英伟达?

木禾投研 浏览 9033 08-06

TCL智家刚柔并济,能否驯服“奥马”?

斑马消费 浏览 3816 07-23

这些才是适合普通人的穿搭!衣服不买贵的重性价比,舒又得体

静儿时尚达人 浏览 137 08-24

多国将承认巴勒斯坦国 支持"两国方案"

国际在线 浏览 75 09-13

卡其裤+蓝衬衫,简单高级

Yuki女人故事 浏览 99 09-20

周锋履新东风汽车集团副总经理、党委常委!他今年46岁、毕业于清华大学

红星资本局 浏览 4446 07-23
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除沪ICP备20017958号-3