关闭广告

Meta万引强化学习大佬跑路!用小扎原话作为离别寄语,扎心了

量子位2025-08-27 00:00:0157人阅读

小扎在这头疯狂挖人,结果家里的老员工纷纷跑路了??

最新消息,Meta万引强化学习大佬Rishabh Agarwal即将离职,还留下了一篇让人浮想联翩的小作文:

  • 这是我在Meta的最后一周。
  • 决定不加入新的超级智能实验室并不容易,毕竟那里人才济济、算力爆棚。但在Google Brain、DeepMind和Meta度过了7年半之后,我更想冒险去尝试一条完全不同的路。
  • Meta组建超级智能团队的想法非常引人注目,但我最终选择听从扎克伯格的建议:“在这个瞬息万变的世界里,最大的风险就是不去冒险。”



虽然表面上看起来双方是“和平分手”,但网友们还是从中嗅出了一丝不同寻常的味道:

  • 把小扎的原话甩回他自己脸上,这操作绝了,瑞思拜!



  • 十亿可以为你买一栋房子,但买不到你的梦想。



不过猜测也好,吐槽也罢。对于Rishabh Agarwal的离职,谷歌、Meta的同事们都清一色地送上了祝福,而且还顺带回顾了他在工作期间作出的贡献。

据了解,他参与了谷歌Gemini 1.5、Gemma 2以及Meta推理模型后训练方面的重要工作,2021年还以一篇RL算法评估论文拿下了NeurIPS杰出论文奖。



所以,Rishabh Agarwals是谁?他的离职又为何在这个节骨眼掀起波澜?

曾被Hinton劝退“不要做强化学习”,下一站未定

Rishabh Agarwals,一直以来从事强化学习和推理研究,谷歌学术论文被上万次引用,h-index也有34。



本科毕业于印度理工学院孟买分校计算机科学与工程专业,成绩属于系前几名那种。

2018年,他以AI Resident的身份加入Google Brain多伦多团队,在Geoffrey Hinton团队里工作了一年。

颇具戏剧性的是,Hinton还曾建议他“不要做强化学习(RL)”,不过话锋一转,老爷子也留有余地——应该做自己认为最好的事情(毕竟他本人当年做的事也不被所有人看好)

于是,Rishabh Agarwals义无反顾地投身强化学习,并决定继续攻读博士学位。

第二年,他就前往蒙特利尔的Mila研究所申请PhD,由于和面试官之一Aaron Courville(和Bengio等人合著了《深度学习》这本经典教材)在强化学习领域的研究方向“完全相同”,当场就被邀请并加入其团队。

接下来的四年时间,他在Aaron Courvilleh和Marc Bellemare两位顶尖导师的指导下继续深耕强化学习,同时还保留着在Google Brain的全职工作。

直到2023年,Marc Bellemare发了一条提前庆祝他通过博士毕业答辩的推文,连谷歌首席科学家Jeff Dean这样的大佬也赶来祝贺。



在这之后,他顺理成章地加入蒙特利尔谷歌DeepMind团队,担任研究科学家,同时在麦吉尔大学做兼职教授。

而在谷歌工作期间,他参与了Gemini 1.5(当时号称最强多模态、上下文突破100万)、Gemma 2(新一代轻量级开源模型)、Gemma 3等重要模型的发布工作。

2021年,他还发表了论文《Deep Reinforcement Learning at the Edge of the Statistical Precipice》,一举斩获NeurIPS杰出论文奖。

简单来说,这篇论文分析了深度强化学习中的统计不稳定性问题,指出在有限实验下评估算法可能产生误导性结果。由于系统性揭示了RL中的方差问题与过拟合风险,被认为是评价RL算法的里程碑工作。



后来他才从谷歌跑去了Meta,并着手推进Meta推理模型的后训练工作,具体包括:

  • 用RL规模化训练,把8B稠密模型推到接近DeepSeek-R1的水平;
  • 在训练中途引入合成数据,为RL提供热启动;
  • 提出更高效的on-policy蒸馏方法。

如今随着Rishabh Agarwals的离开,网友们也纷纷替Meta惋惜又损失了一员大将。



目前Rishabh Agarwals的下一站并未明确,不过按照他“想要尝试完全不同的一条路”的说法,人们推测大概率会是创业。

Meta老员工开始出逃了?

其实不止Rishabh Agarwals,几乎同一时间,一位在Meta工作了12年的老员工也宣布离职了。

而且下一站还是Anthropic的推理团队(属于直接拥抱曾经的竞争对手了)



有一说一,Meta这波渐起的老员工出逃趋势并不出人意料。

此前就有消息称,Meta新老员工之间因薪酬待遇悬殊而产生摩擦,其中一些研究人员甚至威胁要辞职。

合理推测,招聘热潮带来的内部矛盾,可能是导致这些资深员工选择离开的重要原因之一。

嗯,小扎这波也属于一边蓄水,一边开闸了(doge)。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

博主:拜仁正与利物浦推进迪亚斯转会谈判,在谈6500万英镑转会费

直播吧 浏览 7111 07-21

巴媒:科林蒂安有意租借利雅得新月边锋塞萨尔,已咨询相关条件

直播吧 浏览 7612 08-05

媒体人:杨瀚森即将回国,青岛男篮将于明日下午举行媒体见面会

懂球帝 浏览 10010 07-23

王欣瑜补赛速胜进四强,退赛蒙特利尔被猜测为冲击布拉格冠军

网球之家 浏览 2694 07-26

山东济宁一商家芒果礼盒藏试卷、课本 商家回应

极目新闻 浏览 24 10-09

对当前市场的看法:估值不低,但谈泡沫还太早了

锦缎研究院 浏览 4342 07-23

刚刚,蒋凡回应此前饿了么为何不敌美团|附阿里最新业绩会实录

蓝鲸新闻 浏览 51 08-30

押注上海创新力量,达索系统中国首个开放创新实验室启用

上观新闻 浏览 73 08-23

没有点球!水晶宫主帅投诉麦卡手球,裁判经VAR确认后判没有点球

直播吧 浏览 1822 08-11

靠华为技术改变越野车市场格局?32.99万起,猛士M817来了!

电车通 浏览 198 07-19

官方:伊斯坦布尔签下乌兹别克斯坦国脚费祖拉耶夫 转会费750万欧

直播吧 浏览 8258 07-31

小米《财富》世界500强排名297 提升100位创上榜以来最大增幅

封面新闻 浏览 8291 07-30

TA:约克雷斯近两年联赛68球葡超居首,射门抢点速度顶级头球较差

直播吧 浏览 625 07-23

美国前官员谈"特普会":特朗普没有输 但普京显然赢了

澎湃新闻 浏览 5981 08-17

OpenAI重磅发布Sora 2!硬刚抖音豆包谁能赢?

雷科技 浏览 23 10-02

WTT横滨冠军赛国乒10日赛程:王楚钦vs户上隼辅 孙颖莎vs大藤沙月

直播吧 浏览 232 08-10

被提问关于对手外援问题,斯卢茨基:记者提问应该有逻辑性

懂球帝 浏览 8033 07-24

900亿市值通威股份,中报亏损近50亿,创下历史最差

华美财经 浏览 34 08-25

赵伟:增量财政资金落地

首席经济学家论坛 浏览 22 10-20

谷歌:大量创新正在中国涌现,中国开发者成为全球创新的中坚力量

澎湃新闻 浏览 4573 08-14

小米昆仑增程SUV信息汇总:传说中的YU9,明年发布,30万左右起售

GO车情报员 浏览 3759 07-23
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除沪ICP备20017958号-3