关闭广告

DeepSeek开源新基础模型,但不是V4,而是V3.1-Base

机器之心Pro2025-08-20 12:00:017384人阅读



机器之心报道

编辑:Panda

昨晚,深度求索在用户群里宣布「DeepSeek 线上模型版本已升级至 V3.1,上下文长度拓展至 128k」并更新了 UI (去掉了 DeepThink 旁的 R1 标示)之后,在 Hugging Face 发布了一款新模型DeepSeek-V3.1-Base



模型地址:https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Base

从名字也能看出来,该模型是 DeepSeek-V3 系列最新的基础模型。至于为什么命名为 V3.1,而不是像之前以前命名为 V3 带四位日期数字的形式(如 V3-0324),尽管社区有诸多猜测,但深度求索官方尚未给出明确说明 —— 和该公司之前的操作一样,这一次同样是模型先行,说明和宣传还在后面。

该模型一发布就吸引了 AI 社区的广泛关注,短短几个小时就已经冲上了 Hugging Face 热门模型榜第 4 位!



具体技术指标上,DeepSeek-V3.1-Base 与 DeepSeek-V3 差别不大,同样的参数量,采用了混合专家(MoE)架构,拥有 128k 上下文长度。



整体来看,社交网络上对深度求索的这次更新看法不一。有人表示非常振奋,认为这是深度求索在为接下来的 DeepSeek-V4 和 DeepSeek-R2 做铺垫,但也有人认为这次更新不够亮眼,没有达到该公司之前的一贯水准。

对此,你怎么看?

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

市场监管总局将出台新规加强食品销售连锁企业食品安全管理,涉及多家食品上市公司

红星资本局 浏览 7043 08-06

交通运输部:服务区充电桩覆盖率已达到98.4%

澎湃新闻 浏览 8069 07-21

特斯拉美国市占率跌至8年最低!传统车企价格战正蚕食其电动江山

车图腾 浏览 136 09-11

夏天衣服不要总穿宽松的款式,试试这些夏季穿搭,显瘦显气质

静儿时尚达人 浏览 6863 06-01

巴菲特,遭遇罕见滑铁卢

国际金融报 浏览 2508 08-05

章子怡百花晚会偶遇30年好友曾黎

泪满过眼 浏览 72 01-29

高叶被低估,《南京照相馆》走红敲响娱乐圈警钟

老吴教育课堂 浏览 3309 08-03

伊姐周日热推:电视剧《献鱼》;电视剧《子夜归》......

伊周潮流 浏览 7902 08-18

Momenta“最强大脑”上车 别克至境L7再“亮剑”

网易汽车 浏览 8993 08-21

曼城在闭门热身赛中1-0击败普雷斯顿,里科-刘易斯打进唯一进球

直播吧 浏览 8325 08-03

iQOO Z10 Turbo+ 手机官宣 8 月 7 日发布,TWS Air3 同步亮相

IT之家 浏览 370 07-31

即时零售锁死了前置仓的天花板

斑马消费 浏览 1006 08-13

外媒披露乌军工业"家底":计划年产无人机约1800万架

每日经济新闻 浏览 4727 07-20

李湘王岳伦合体露面被偶遇,离婚后仍相处融洽,两人身材很富态

扒虾侃娱 浏览 116 10-27

售14.99万起 纯电大五座SUV新别克E5上市

网易汽车 浏览 8088 06-23

队友赞库尼亚:做对手和队友完全不一样;他就是曼联需要的球员

直播吧 浏览 1352 08-21

媒体:卡德罗夫被指险溺水身亡 儿子能否接班仍存变量

中国新闻周刊 浏览 3256 08-05

记者:曼联有信心在未来两天内完成拉芒转会

懂球帝 浏览 93 08-27

全新日产Sentra预想图曝光:造型更激进,三套动力可选

老爷车 浏览 4869 07-14

靠“早C晚A”火出圈!HBN赴港递表,44%抖音平台复购率印证国民好感|港E声

时代周报 浏览 69 01-28

3件开心小事|| 这条视频竟然有一千万人看了

黎贝卡的异想世界 浏览 87 12-24
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除沪ICP备20017958号-3