关闭广告

通义千问推出系列中首个图像生成基础模型Qwen-Image

证券时报2025-08-05 12:00:019663人阅读



通义千问发布了首个开源图像生成基础模型Qwen-Image,Qwen-Image是一个200亿参数的MMDiT模型,是通义千问系列中首个图像生成基础模型。

该模型在文本渲染方面表现卓越,支持中英文多行段落级高保真文本渲染,对复杂场景和细粒度细节处理能力强。Qwen-Image具备一致性的图像编辑能力,通过增强的多任务训练范式,在编辑过程中能保持内容的一致性。

在GenEval、DPG、OneIG-Bench、GEdit、ImgEdit、GSO等多个公开基准测试中,Qwen-Image均取得了最先进(SOTA)的性能。特别是在LongText-Bench、ChineseWord和TextCraft等文本渲染基准上,Qwen-Image表现突出,尤其是在中文文本渲染方面大幅领先现有模型。Qwen-Image能够准确渲染海报、PPT页面等多种包含复杂文本和图像组合的场景。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

联合国对达成加沙地带停火协议表示欢迎

极目新闻 浏览 38 10-09

赵露思又发文,这次估计是真不干了

东方不败然多多 浏览 6761 08-03

以方收到哈马斯对停火提案回应 或在多哈间接谈判

新京报 浏览 6727 07-05

支持双5C超充,阿维塔06 Ultra增程版上市

观察者网 浏览 94 09-01

居然智家董事长突然离世,家居行业到底发生了什么?

郭施亮 浏览 933 07-29

皇马官方:将于北京时间明天19点为马斯坦托诺举办亮相仪式

懂球帝 浏览 6257 08-14

网友称小区1楼4户业主联合私挖地下室 官方回应

潇湘晨报 浏览 45 10-20

窦泽成下赛季重返美巡赛

体坛周报 浏览 49 10-13

30.98万起 标配多项黑科技 腾势D9新品发布

网易汽车 浏览 91 08-30

解码基金“擒牛术”!从同花顺到新易盛,三波牛市验证三大选股核心逻辑

券商中国 浏览 24 01-13

不设上限/不限首任车主/终身享有 比亚迪回应智能泊车兜底权益

网易汽车 浏览 8225 07-11

小鹏汽车出海新动态:小鹏 MONA 正式发往中东非

IT之家 浏览 44 10-13

AI Agent行业应用价值及全球市场机遇洞察

霞光社 浏览 998 07-31

国安球员&内部人士:输申花心情难过,足协杯不能再有闪失

懂球帝 浏览 7251 07-21

稳定币2028年市场规模达2万亿美元?摩根大通泼“冷水”

环球网资讯 浏览 3909 07-25

94岁杨少华高温天气被推去剪彩,下午就去世了,家属评论区沦陷

萌神木木 浏览 3642 07-10

92岁陶玉玲去世,身患3癌丧女又丧夫

疯说时尚 浏览 10 01-16

宋佳,真的好叛逆!

宛沐 浏览 1293 07-11

华为云CEO:CloudMatrix超节点可实现百万卡超大集群

观察者网 浏览 55 09-21

第三代UNI-V正式上市 指导价10.29-11.99万元

网易汽车 浏览 2351 08-09

限时售价6.58万起 全新MG4成都车展正式上市

网易汽车 浏览 87 08-30
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除沪ICP备20017958号-3