关闭广告

阿里巴巴正式推出Qwen3-Max,稳居全球顶尖模型之列

财闻2025-09-24 12:00:0284人阅读

9月24日,据“通义千问Qwen”微信公众号消息,阿里巴巴推出Qwen3-Max——迄今为止规模最大、能力最强的模型。目前,Qwen3-Max-Instruct的预览版在LMArena文本排行榜上位列第三,超越了GPT-5-Chat。正式版本在代码能力和智能体(agent)能力方面进一步提升,在涵盖知识、推理、编程、指令遵循、人类偏好对齐、智能体任务和多语言理解的全面基准测试中均达到业界领先水平。

Qwen3-Max模型总参数超过1T,预训练使用了36T tokens。Qwen3-Max-Instruct的预览版已在LMArena文本排行榜上稳居全球前三。正式发布版本进一步提升了其能力,尤其在代码生成与智能体表现方面表现卓越。在专注于解决现实编程挑战的基准测试SWE-Bench Verified上,Qwen3-Max-Instruct取得了高达69.6分的优异成绩,稳居全球顶尖模型之列。此外,在评估智能体工具调用能力的严苛基准Tau2-Bench上,Qwen3-Max-Instruct更是实现了突破性表现,以74.8分超越Claude Opus 4与DeepSeek-V3.1。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

驳斥"解除武装" 哈马斯:建国后再谈

每日经济新闻 浏览 6189 08-03

2026款本田奥德赛正式上市 售23.58万元起

车质网 浏览 89 08-29

号称荣耀最强健康监测智能手表,荣耀手表5 Pro 10月15日发布

IT之家 浏览 98 10-09

一年要卖出400万辆车,零跑汽车发布未来十年战略

贝壳财经 浏览 34 12-29

国内首个开放式机器人租赁平台在沪发布,已触达50个重点城市

澎湃新闻 浏览 28 12-23

特朗普:英特尔只是开始!考虑进行更多交易

第一财经资讯 浏览 85 08-26

iPhone Air国行版要来了!联通eSIM预约通道正式开放

三言科技 浏览 63 10-13

哈曼:利物浦防守太弱,也失去了阿诺德传威胁球的能力和影响

懂球帝 浏览 243 08-19

40+女人,有钱没钱都要穿得漂亮!试试这几个穿搭技巧,实用

静儿时尚达人 浏览 2997 06-21

葡媒:若热-科斯塔的骨灰盒被抬到波尔图主场,接受最后的致敬

懂球帝 浏览 7010 08-07

我国青海省绿色算力规模达1.5万 PFLOPS,一年半增长近40倍

IT之家 浏览 6298 07-20

雷军回应YU7首拆:欢迎同行和专家指点

盖世汽车 浏览 54 11-07

马斯克遭特斯拉股东集体起诉 本人怒斥发起律师"人渣"

红星新闻 浏览 8402 08-07

秦力洪:蔚来穿越了风暴周期,三季度将迎转折,但远没有到开香槟的时候

红星资本局 浏览 92 09-01

马苏近况曝光,已成前男友孔令辉高攀不起的存在

云舟史策 浏览 1934 08-11

韩国峰会临近特朗普频频放风 突然公布一涉华重磅消息

现代小青青慕慕 浏览 56 10-24

中型SUV定位/全新设计加持 一汽-大众捷达VS8亮相

网易汽车 浏览 6518 07-15

太阳报:切尔西手机APP票务系统瘫痪,数千球迷无法验票进场

直播吧 浏览 295 08-18

牛弹琴:越南或在最后一刻遭特朗普暗算 十分失望愤怒

上观新闻 浏览 2997 07-12

涉债权1600亿,中信信托“啃”下金科重整服务信托资产包

密探财经 浏览 75 09-29

国家级5G智慧工厂背书,全新深蓝S07上市交付

经济观察报 浏览 88 09-22
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除沪ICP备20017958号-3