关闭广告

DeepSeek开源新基础模型,但不是V4,而是V3.1-Base

机器之心Pro2025-08-20 12:00:017223人阅读



机器之心报道

编辑:Panda

昨晚,深度求索在用户群里宣布「DeepSeek 线上模型版本已升级至 V3.1,上下文长度拓展至 128k」并更新了 UI (去掉了 DeepThink 旁的 R1 标示)之后,在 Hugging Face 发布了一款新模型DeepSeek-V3.1-Base



模型地址:https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Base

从名字也能看出来,该模型是 DeepSeek-V3 系列最新的基础模型。至于为什么命名为 V3.1,而不是像之前以前命名为 V3 带四位日期数字的形式(如 V3-0324),尽管社区有诸多猜测,但深度求索官方尚未给出明确说明 —— 和该公司之前的操作一样,这一次同样是模型先行,说明和宣传还在后面。

该模型一发布就吸引了 AI 社区的广泛关注,短短几个小时就已经冲上了 Hugging Face 热门模型榜第 4 位!



具体技术指标上,DeepSeek-V3.1-Base 与 DeepSeek-V3 差别不大,同样的参数量,采用了混合专家(MoE)架构,拥有 128k 上下文长度。



整体来看,社交网络上对深度求索的这次更新看法不一。有人表示非常振奋,认为这是深度求索在为接下来的 DeepSeek-V4 和 DeepSeek-R2 做铺垫,但也有人认为这次更新不够亮眼,没有达到该公司之前的一贯水准。

对此,你怎么看?

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

官方:国米先租后买签下萨索洛21岁右后卫钦奎格拉诺

直播吧 浏览 8251 07-31

日本羽毛球公开赛:石宇奇2-0横扫夺冠,国羽3冠1亚收官

全景体育V 浏览 8933 07-21

葡萄牙足协官方:将在8月8日至11日举行的所有赛事中对科斯塔默哀

懂球帝 浏览 6151 08-06

名嘴:上赛季活塞的表现让人印象深刻 下赛季胜场数会超45.5场

直播吧 浏览 170 08-12

难怪岳云鹏的演唱会成功,原来他身后不止郭德纲

东方不败然多多 浏览 7556 07-30

苏州90后小伙买房被熟人骗2062万 开了间"反诈咖啡馆"

扬子晚报 浏览 4069 08-06

莫斯科举行阅兵式彩排 战机编队飞过红场

国际在线 浏览 5259 05-07

博主住进月租6万甲醛房身体患病进展:房东退还押金

潇湘晨报 浏览 8548 07-24

险胜波黑三槽点太明显!后卫处理糟糕,前板吃亏,球员执行呆板!

篮球资讯达人 浏览 4651 07-30

嫦娥六号月球样品最新研究成果发布 揭开月背“神秘面纱”

环球网资讯 浏览 8766 08-09

德天空:纽卡与谢什科开展了实质性的谈判,莱比锡已知晓

懂球帝 浏览 3345 07-26

配置升级 新款雷克萨斯LC500敞篷版官图发布

车质网 浏览 6084 07-21

前女友曝许凯出轨 于正说在酒店背台词

TVB的四小花 浏览 15 08-23

天空:多特仍积极推动引进桑乔,曼联更想出售但也不排除将其外租

直播吧 浏览 3926 08-05

以色列总理接受美方提出的加沙地带停火方案

新华社 浏览 1004 05-31

0-6惨案!33岁内马尔被打哭了:创17年之耻 球迷背身抗议

叶青足球世界 浏览 5841 08-18

毫无底线!博主到大S墓地直播

失宠的小野猪 浏览 1116 08-07

男篮热身赛再挖奇兵!雷蒙防守奠定胜局,进攻把握三分,太香了!

篮球资讯达人 浏览 5767 07-30

9月1日法庭见!KK集团起诉名创优品

国际金融报 浏览 2364 08-19

路博润:看好中国润滑油市场,将与车企合作应对电动化挑战

经济观察报 浏览 3504 07-23

2万亿,3674点,都回来了,后市如何走?

21世纪经济报道 浏览 3025 08-14
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除沪ICP备20017958号-3