关闭广告

阿里巴巴正式推出Qwen3-Max,稳居全球顶尖模型之列

财闻2025-09-24 12:00:0285人阅读

9月24日,据“通义千问Qwen”微信公众号消息,阿里巴巴推出Qwen3-Max——迄今为止规模最大、能力最强的模型。目前,Qwen3-Max-Instruct的预览版在LMArena文本排行榜上位列第三,超越了GPT-5-Chat。正式版本在代码能力和智能体(agent)能力方面进一步提升,在涵盖知识、推理、编程、指令遵循、人类偏好对齐、智能体任务和多语言理解的全面基准测试中均达到业界领先水平。

Qwen3-Max模型总参数超过1T,预训练使用了36T tokens。Qwen3-Max-Instruct的预览版已在LMArena文本排行榜上稳居全球前三。正式发布版本进一步提升了其能力,尤其在代码生成与智能体表现方面表现卓越。在专注于解决现实编程挑战的基准测试SWE-Bench Verified上,Qwen3-Max-Instruct取得了高达69.6分的优异成绩,稳居全球顶尖模型之列。此外,在评估智能体工具调用能力的严苛基准Tau2-Bench上,Qwen3-Max-Instruct更是实现了突破性表现,以74.8分超越Claude Opus 4与DeepSeek-V3.1。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

被“遗忘”的砂锅菜

餐饮老板内参 浏览 93 09-01

德天空:沃尔夫斯堡与诺维奇前锋萨尔根特达成口头协议

直播吧 浏览 9600 07-19

泰国使用F-16战斗机对多个地点进行空袭 柬埔寨谴责

新京报 浏览 27 12-17

武大事件升级 疑老师辟谣:女方保研合规 14人中排第9

火山诗话 浏览 6985 08-05

分手传闻才3个月,关晓彤又有喜讯,原来鹿晗早就“高攀不起”她

老吴教育课堂 浏览 1970 07-16

7年联姻终止!蔚来合资公司注销

敖博管理 浏览 72 09-17

造福or替代程序员?实测阿里新模型

虎嗅APP 浏览 8164 07-24

乐道L90内饰官图发布,7月10日全面到店并开启预售

皆电 浏览 6730 07-03

S妈含泪手捧小s奖杯,姐姐大S的遗照摆在角落

素素娱乐 浏览 26 12-11

奇瑞太“冤”了:你们搞“电池弹射”的缺德试验,捎上我干啥?

小李车评李建红 浏览 93 09-25

天空:多特仍在推动签下桑乔,但尚未向曼联提交正式报价

懂球帝 浏览 2280 08-05

交管上线黑名单,网约车司机:完了,被停止派单了

用车指南 浏览 2879 06-14

王鸥女儿疑曝光!扎着小辫胖嘟嘟,知情人曝王鸥和何九华已结婚

探源历史 浏览 5859 07-15

销量创近8年新高!半年卖出135万辆,长安汽车还差一个“爆款”?

时代周报 浏览 89 08-23

险企投资收益波动加大 业绩分化利润水平提升

证券市场周刊 浏览 46 10-11

恩爱8年,这对夫妻的年龄差距能克服这么多困难

归史 浏览 66 09-26

店主被城管咬破手指 想拿砖头砸人被劝"想想你儿子"

极目新闻 浏览 98 09-29

2025年度榜单|| 真金白银票选出来的“真爱”,今天破价1.6折!

黎贝卡的异想世界 浏览 5 01-24

陈宇浩:我们一直踢自己的攻势足球,过早丢分和红牌是转折

懂球帝 浏览 8251 08-10

他俩因戏生情18年,如今和董洁演两口子再度翻红

猛哥的搞笑视频 浏览 4799 07-21

累坏了,库尼亚打进扳平球+中框1次,贡献解围2次拦截2次

懂球帝 浏览 11 01-05
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除沪ICP备20017958号-3