关闭广告

DeepSeek开源新基础模型,但不是V4,而是V3.1-Base

机器之心Pro2025-08-20 12:00:017307人阅读



机器之心报道

编辑:Panda

昨晚,深度求索在用户群里宣布「DeepSeek 线上模型版本已升级至 V3.1,上下文长度拓展至 128k」并更新了 UI (去掉了 DeepThink 旁的 R1 标示)之后,在 Hugging Face 发布了一款新模型DeepSeek-V3.1-Base



模型地址:https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Base

从名字也能看出来,该模型是 DeepSeek-V3 系列最新的基础模型。至于为什么命名为 V3.1,而不是像之前以前命名为 V3 带四位日期数字的形式(如 V3-0324),尽管社区有诸多猜测,但深度求索官方尚未给出明确说明 —— 和该公司之前的操作一样,这一次同样是模型先行,说明和宣传还在后面。

该模型一发布就吸引了 AI 社区的广泛关注,短短几个小时就已经冲上了 Hugging Face 热门模型榜第 4 位!



具体技术指标上,DeepSeek-V3.1-Base 与 DeepSeek-V3 差别不大,同样的参数量,采用了混合专家(MoE)架构,拥有 128k 上下文长度。



整体来看,社交网络上对深度求索的这次更新看法不一。有人表示非常振奋,认为这是深度求索在为接下来的 DeepSeek-V4 和 DeepSeek-R2 做铺垫,但也有人认为这次更新不够亮眼,没有达到该公司之前的一贯水准。

对此,你怎么看?

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

北京现代2025年上半年销量稳步回升,6月增长势头强劲

汽车有文化 浏览 9227 07-03

A股董事被拘!涉嫌违法放贷,早年工行履历被关注

财通社 浏览 67 10-15

以AI治AI 推动智能向善 巨量引擎商业安全开放日在京举办

一点财经 浏览 55 10-26

不在乎中国市场?全智贤方风波后仍未道歉,昔日傲慢模样全被扒

扒虾侃娱 浏览 66 09-22

罗晋唐嫣婚变进入倒计时!?

八卦疯叔 浏览 33 10-26

德云社内部开撕后续!秦霄贤前女友爆料

章幃户外 浏览 2009 08-07

特朗普称如需要美将发动更大规模袭击

新华社 浏览 10 01-04

男子称直播间买翡翠买到石英岩 申请退款仍被强制发货

大风新闻 浏览 160 08-29

今日热点:官方回应李现拍鸟成公务员省考面试题;网飞回应《忘了我记得》疑似抄袭……

伊周潮流 浏览 7649 05-31

"10岁男孩被烟花炸伤头部身亡"案二审开庭 被告拒担责

极目新闻 浏览 46 10-15

《朝雪录》开分惊现冰火两重天!颜狗狂欢!

阿废冷眼观察所 浏览 4892 07-18

拐点来临!苏宁易购“大店战略”三年成效显现

时代周报 浏览 104 09-01

高通发布骁龙X2 Elite与第五代骁龙8至尊版,全面押注端侧AI生态

DeepTech深科技 浏览 75 09-26

克宫"打脸"特朗普:俄乌没有安排新的直接和平谈判

财联社 浏览 6202 05-23

《逍遥》大结局:秉烛结束了红烨,肖瑶曾为妖王!

肆季娱乐 浏览 15 01-05

王祉怡2-0战胜山口茜,晋级日本羽毛球公开赛决赛

懂球帝 浏览 4086 07-19

我国自主研制的6000米级深海无人遥控潜水器“海琴”号在南海成功海试

新华社 浏览 86 08-25

韩鹏:很高兴能战胜争冠球队,全体球员的发挥都非常出色

懂球帝 浏览 40 10-27

邮报:利物浦前员工涉及多年球票欺诈勾结黄牛牟利,审判已开始

懂球帝 浏览 47 11-01

曾亲历阅兵的退役军人:训练瘦20斤 有队友体重降50斤

上观新闻 浏览 86 09-02

托辛:很荣幸在队内是资深球员;“叔叔”的外号来自马杜埃凯

懂球帝 浏览 58 10-23
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除沪ICP备20017958号-3