关闭广告

DeepSeek R2有望8月下旬发布?内部人士:不属实

澎湃新闻2025-08-14 00:00:019334人阅读

近日有市场传言称,国产大模型公司深度求索旗下DeepSeek R2有望在8月15日至30日期间发布。

8月13日,DeepSeek内部人士向澎湃新闻记者表示,上述消息不属实。

早在今年4月,就有传言称,深度求索可能将在5月推出下一代AI大模型DeepSeek-R2。当时有报道称,DeepSeek-R2大模型将会采用一种更先进的混合专家模型(MoE),其结合更加智能的门控网络层(Gating Network)以优化高负载推理任务的性能。

不过,上述内部人士曾向记者坦言,该传言真实度不高。

此后,DeepSeek官宣推出R1新版本,业内普遍认为这是取代了R2的发布。

5月29日,据DeepSeek公告,DeepSeek R1模型已完成小版本升级,当前版本为DeepSeek-R1-0528。用户通过官方网站、APP或小程序进入对话界面后,开启“深度思考”功能即可体验最新版本。API也已同步更新,调用方式不变。

公告指出,DeepSeek-R1-0528使用2024年12月所发布的DeepSeek V3 Base模型作为基座,但在后训练过程中投入了更多算力,显著提升模型的思维深度与推理能力。更新后的R1模型在数学、编程与通用逻辑等多个基准测评中取得当前国内所有模型中首屈一指的优异成绩,并且在整体表现上已接近其他国际顶尖模型,如o3与Gemini-2.5-Pro。

相较于旧版R1,新版模型在复杂推理任务中的表现有显著提升。例如在AIME2025测试中,新版模型准确率由旧版的70%提升至87.5%。这一进步得益于模型在推理过程中的思维深度增强:在AIME2025测试集上,旧版模型平均每题使用12K tokens,而新版模型平均每题使用23Ktokens,表明其在解题过程中进行了更为详尽和深入的思考。

大模型行业的内卷正在加剧。7月31日,据国际开源社区Hugging-Face最新趋势热榜显示,前十名模型中,有9个是国产大模型,其中排名第一的是智谱最新发布的新一代旗舰大模型GLM-4.5,排名第二的是阿里旗下通义千问模型Qwen3,而腾讯混元最新发布的3D模型则排行第三。

但据排名数据显示,DeepSeek R1在Hugging-Face趋势热榜中并不靠前,不过其依然是目前点赞最多的大模型,DeepSeek R1收到了1.25万个赞(like),远超其他国产大模型。

在年初成为大模型产业王炸黑马后,DeepSeek成为国内大模型厂商的集体竞标对手,包括MiniMax、月之暗面等知名大模型公司或明或暗都提出了对标DeepSeek的目标,且在更新迭代上进展迅速。作为中国开源大模型的“风向标”,DeepSeek正在面临更激烈竞争。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

丁克50年,村上春树的太太原来这么酷

观察鉴娱 浏览 3896 07-13

突发!英伟达暂停生产H20芯片,黄仁勋突访中国台湾引猜疑

爱集微 浏览 78 08-22

商竣程香港250赛再爆大冷排名狂飙95位,郑钦文官宣退出2026澳网

网球之家 浏览 16 01-09

独一无二,世界巨星蒂尔达·斯文顿卓越之作!

幕味儿 浏览 45 10-26

硬核科技赋能 银河通用“太空舱”落地中网

环球网资讯 浏览 93 10-02

长城汽车计划再投资元戎启行 金额8亿—10亿元

经济观察报 浏览 8507 07-24

这一次变了面相的关晓彤给所有女星提了个醒

探长影视解说 浏览 2864 08-16

执法过严?拓王之战首节裁判合计吹罚21次犯规并出现31次罚球

懂球帝 浏览 42 10-11

金价明年破5000美元?分析:前提是“美元贬值交易”重新流行

华尔街见闻官方 浏览 36 11-08

59岁温碧霞美到认不出!3岁差点被卖,嫁入豪门婚后被宠成公主

娱乐白名单 浏览 6104 08-10

中纪委连发10人被查信息 有人退休后主动投案

21世纪经济报道 浏览 2819 08-05

连续3天逆跌,票房会破4亿?陈思诚都压不住,这才是暑期档大黑马

靠谱电影君 浏览 234 07-08

来自世界人工智能大会的一线观察:“火爆”的智能体为何投资不温不火

文汇报 浏览 6119 07-28

拉波尔塔:姆巴佩的做法确实让我感到意外,无论输赢都要大度

懂球帝 浏览 10 01-13

TVB男星被嘲吃软饭,回答显高情商,与继女相处融洽夫妻财政独立

动物奇奇怪怪 浏览 6361 08-04

说点大家不知道的!名记:菲利克斯加盟利雅得胜利只差官宣

直播吧 浏览 1143 07-29

百度发布全球首个全端通用Agent:可同时调用超100个专家智能体,分钟级交付

网易科技报道 浏览 4027 08-19

米体:亚沙里2023年也罢训向母队施压要求离队,但没成功

懂球帝 浏览 1068 07-31

Anthropic被曝洽谈最高50亿美元融资,估值达1700亿美元

澎湃新闻 浏览 2767 07-31

《花少7》出圈理由:那英的性格,陈数的脸,李沁的衣品

娱乐圈笔娱君 浏览 8467 08-17

“奶奶风耳饰”火了!时髦洋气巨显脸小!今秋必备!

Yuki女人故事 浏览 59 10-09
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除沪ICP备20017958号-3