关闭广告

DeepSeek开源新基础模型,但不是V4,而是V3.1-Base

机器之心Pro2025-08-20 12:00:017306人阅读



机器之心报道

编辑:Panda

昨晚,深度求索在用户群里宣布「DeepSeek 线上模型版本已升级至 V3.1,上下文长度拓展至 128k」并更新了 UI (去掉了 DeepThink 旁的 R1 标示)之后,在 Hugging Face 发布了一款新模型DeepSeek-V3.1-Base



模型地址:https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Base

从名字也能看出来,该模型是 DeepSeek-V3 系列最新的基础模型。至于为什么命名为 V3.1,而不是像之前以前命名为 V3 带四位日期数字的形式(如 V3-0324),尽管社区有诸多猜测,但深度求索官方尚未给出明确说明 —— 和该公司之前的操作一样,这一次同样是模型先行,说明和宣传还在后面。

该模型一发布就吸引了 AI 社区的广泛关注,短短几个小时就已经冲上了 Hugging Face 热门模型榜第 4 位!



具体技术指标上,DeepSeek-V3.1-Base 与 DeepSeek-V3 差别不大,同样的参数量,采用了混合专家(MoE)架构,拥有 128k 上下文长度。



整体来看,社交网络上对深度求索的这次更新看法不一。有人表示非常振奋,认为这是深度求索在为接下来的 DeepSeek-V4 和 DeepSeek-R2 做铺垫,但也有人认为这次更新不够亮眼,没有达到该公司之前的一贯水准。

对此,你怎么看?

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

35岁郑爽近照曝光!脸部又僵又肿网友直呼认不出,彻底成了素人

萌神木木 浏览 20 01-08

贺炜:洪水虽然可以漫过村超的草皮,但热爱永不沉没

懂球帝 浏览 473 07-27

中俄海军将举行联合演习 首提"联合应对西太安全威胁"

环球网资讯 浏览 6320 07-31

张予曦毕雯珺好敬业,剧播完那么久了 还一直营业

东方不败然多多 浏览 84 09-01

苹果 iPhone 17 系列 4 款机型颜色阵容渲染图曝光:多彩选择

IT之家 浏览 4679 07-19

9月MPV销量榜大洗牌,魏牌高山首夺魁,新能源车型主导市场格局

玩车专家1 浏览 57 10-13

3年亏掉基民200亿,却收20多亿管理费!千亿基金公司,又一位副总要跑?

深蓝财经 浏览 6956 07-29

“知产”变“资产”,看这家银行如何助企破局

Daily每日财报 浏览 4902 07-27

美媒晒杜兰特与球迷合照 左手拇指已无护具 脚相当长

直播吧 浏览 7772 08-19

中学已婚女老师色诱勾引男学生 聊天内容流出不堪入目

社会酱 浏览 2663 07-29

内维尔:约克雷斯在阿森纳机会更多只进10球不够 塞斯科10球及格

直播吧 浏览 6368 08-18

2.3亿票房,二手玫瑰唱片尾曲,这部六合一聊斋套餐属实有些颠

最爱酷影视 浏览 4342 08-03

新东方员工再出新歌"骂"公司 俞敏洪曾奖励12万

界面新闻 浏览 40 11-11

联合国秘书长呼吁抓住机遇 结束加沙冲突

国际在线 浏览 39 10-04

闻“风”而动!保险业全力迎战“桦加沙”,巨灾险仍面临三大挑战

国际金融报 浏览 76 09-26

观众对白百何的评价,明白了当年宋丹丹那番话

娱乐圈笔娱君 浏览 36 11-12

“第三象限”的投资之道

证券市场周刊 浏览 89 08-22

全球经济,有了大麻烦

米筐投资 浏览 5786 07-21

果壳直击CES:具身智能下班时刻

果壳 浏览 18 01-12

商人遭警察逼迫签千万调解协议后又被抓 检方赔偿18万

澎湃新闻 浏览 134 08-21

麻烦大了,凤凰传奇再次遭受“重创”

访史 浏览 780 07-09
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除沪ICP备20017958号-3