关闭广告

Qwen3深夜升级,碾压Kimi K2和DeepSeek V3

新智元2025-07-22 12:00:018242人阅读

刚刚,Qwen3迎来惊喜升级![庆祝][庆祝][庆祝]

通义千问更新了旗舰版Qwen3模型,推出Qwen3-235B-A22B-FP8非思考模式(Non-thinking)的更新版本,命名为:

Qwen3-235B-A22B-Instruct-2507-FP8。

新的Qwen3模型,通用能力显著提升,包括指令遵循、逻辑推理、文本理解、数学、科学、编程及工具使用等方面。

在GQPA(知识)、AIME25(数学)、LiveCodeBench(编程)、Arena-Hard(人类偏好对齐)、BFCL(Agent能力)等众多测评中表现出色,超过Kimi-K2、DeepSeek-V3等顶级开源模型以及Claude-Opus4-Non-thinking等领先闭源模型。

此外,刚刚更新的Qwen3模型,还增强了以下关键性能:
· 在多语言的长尾知识覆盖方面,模型取得显著进步。
· 在主观及开放性任务中,模型显著增强了对用户偏好的契合能力,能够提供更有用的回复,生成更高质量的文本。
· 长文本提升到256K,上下文理解能力进一步增强。

为获得最佳性能,阿里也贴心地为大家准备了推荐配置:
· 采样参数:Temperature=0.7、TopP=0.8、TopK=20、MinP=0 · 合适的输出长度:输出长度为16,384Token,这对于指令模型来说已经足够
· 规范输出格式:
数学问题:在提示词中加入「请一步一步推理,并将最终答案放入\x5cboxed{}中。」
多项选择题:在提示词中添加以下JSON结构以规范回复格式:「请在answer字段中仅填写选项字母,例如:"answer": "C"。」

注意:此模型仅支持非思考模式,在输出中不会生成块。同时,不再需要指定enable_thinking=False。

目前,Qwen3新模型已在魔搭社区和Hugging Face上开源:
https://huggingface.co/Qwen/Qwen3-235B-A22B-Instruct-2507-FP8













版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

牛弹琴:特朗普干了件好事 一连串电话打到了东南亚

映象网 浏览 4748 07-27

苹果iOS 26现端倪,带屏HomePod相关表述

IT之家 浏览 2142 07-23

成都vs国安第7分钟,成都球迷举起球衣声援韦世豪

懂球帝 浏览 7656 07-27

对黄金征税?白宫紧急表示“是个误会”

国际金融报 浏览 2450 08-12

私生粉称王鹤棣与神秘女友吵架

观威海 浏览 17 08-27

偶像剧女王现状:一个拼命生娃,一个坚持不婚

Yuki女人故事 浏览 3182 06-21

吴晓求解读稳定币:只是货币功能的延伸

网易财经 浏览 9769 07-30

港股“消费三姐妹”大涨,泡泡玛特股价创新高,今年以来已上涨252%

红星资本局 浏览 5772 08-21

两周抛售2.5亿美元!Prosus开始减持美团40亿美元股份

华尔街见闻官方 浏览 1761 07-31

博主称住进月租6万元甲醛房 房东:家人信息泄露将维权

极目新闻 浏览 3090 07-18

电子—光子—量子一体化芯片系统诞生

环球网资讯 浏览 5456 07-18

iPhone 17量产郑州富士康招工 求职者:3个月能赚2万多

每日经济新闻 浏览 4100 08-21

田栩宁梓渝酒店开房?柯淳惨卖!

八卦疯叔 浏览 2555 07-27

45岁董璇自曝想生二胎,妈妈称要尊重男方

萌神木木 浏览 1946 08-10

腾讯“AI全家桶”集中亮相世界人工智能大会

观察者网 浏览 4736 07-27

袁立吐槽章子怡、张国立:有钱能使鬼推磨

冷紫葉 浏览 8440 08-05

演唱会偷情被6万人抓奸后续!乐队成被告

置身事内 浏览 5108 07-21

苹果加速搬迁产线,印度成美国最大手机出口国

网易科技报道 浏览 9556 07-30

质感女人怎么都在穿这个颜色?

时尚COSMO 浏览 8 08-28

乔布斯之女与英国马术奥运冠军举办婚礼 哈里斯出席

红星新闻 浏览 2425 07-28

董璇婚后为女儿与丈夫张维伊分居?

古希腊掌管月桂的神 浏览 2144 07-25
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除沪ICP备20017958号-3