关闭广告

DeepSeek开源新基础模型,但不是V4,而是V3.1-Base

机器之心Pro2025-08-20 12:00:017254人阅读



机器之心报道

编辑:Panda

昨晚,深度求索在用户群里宣布「DeepSeek 线上模型版本已升级至 V3.1,上下文长度拓展至 128k」并更新了 UI (去掉了 DeepThink 旁的 R1 标示)之后,在 Hugging Face 发布了一款新模型DeepSeek-V3.1-Base



模型地址:https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Base

从名字也能看出来,该模型是 DeepSeek-V3 系列最新的基础模型。至于为什么命名为 V3.1,而不是像之前以前命名为 V3 带四位日期数字的形式(如 V3-0324),尽管社区有诸多猜测,但深度求索官方尚未给出明确说明 —— 和该公司之前的操作一样,这一次同样是模型先行,说明和宣传还在后面。

该模型一发布就吸引了 AI 社区的广泛关注,短短几个小时就已经冲上了 Hugging Face 热门模型榜第 4 位!



具体技术指标上,DeepSeek-V3.1-Base 与 DeepSeek-V3 差别不大,同样的参数量,采用了混合专家(MoE)架构,拥有 128k 上下文长度。



整体来看,社交网络上对深度求索的这次更新看法不一。有人表示非常振奋,认为这是深度求索在为接下来的 DeepSeek-V4 和 DeepSeek-R2 做铺垫,但也有人认为这次更新不够亮眼,没有达到该公司之前的一贯水准。

对此,你怎么看?

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

从“机器图灵”到“数字黑匣”,120件未来感十足的作品亮相明华糖仓

文汇报 浏览 34 09-26

34岁郑爽突传消息,想从美国回来

趣文说娱 浏览 8259 08-15

四川一花上亿打造的小区会所将对外开放 业主不干了

红星新闻 浏览 8191 07-23

达尔优推出 COOL68 磁轴键盘:影刃/冰刃双磁轴可选

IT之家 浏览 7344 08-05

对话千岛沈振宇:不要问我下一个Labubu是谁,我只知道它很快会来

晚点LatePost 浏览 61 08-27

260亿重庆啤酒,6亿增资佛山工厂

21财闻汇 浏览 1478 08-19

苏丹尼罗州首府遭无人机袭击 致11名平民死亡

国际在线 浏览 1689 04-26

*ST天茂将终止上市,年亏损额超6亿元 

界面新闻 浏览 28 09-26

E句话| 姐有新恋情啦?

仙女事件簿 浏览 12 10-21

特朗普访日 高市早苗将罕见与其共同搭乘美国总统专机

新京报 浏览 3 10-28

郭德纲没想到,郭汾阳一句话,让郭麒麟放弃继承

律便利 浏览 49 08-22

今年秋天,有这几件单品就够了

黎贝卡的异想世界 浏览 11 10-18

马卡:皇马将在国家德比展出巨型TIFO,彰显俱乐部的历史

懂球帝 浏览 7 10-26

奥特曼首晒GPT-5实测!被曝使用老团队遗产

量子位 浏览 459 08-05

医学生被安排到电子厂实习还被克扣工资 当事学校回应

极目新闻 浏览 61 08-23

iPhone将放弃L异形电池!苹果终于悟了,国产手机笑了

雷科技 浏览 1839 08-07

佟丽娅沦为车展“挂件”,陈思诚却带嫩妹出国?

橙星文娱 浏览 9513 07-08

日企高层紧急赴台“负荆请罪”

观察者网 浏览 9108 08-10

李强签署国务院令,公布《住房租赁条例》

澎湃新闻 浏览 8719 07-22

XPPen 推出 Artist Ultra 16 触控手绘屏:UHD AMOLED,16K 压感

IT之家 浏览 32 09-29

阿里云一口气发布七款模型,吴泳铭:终极目标直指ASI

蓝鲸新闻 浏览 18 09-25
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除沪ICP备20017958号-3