第一资讯站

  • 首页
  • 手机数码
    • 苹果手机
    • 华为手机
    • 小米手机
  • 人工智能
  • 智能制造
  • 游戏电竞
登录 | 注册
  1. 首页
  2. 人工智能
  3. 正文

阿里开源图像大模型,实测中文渲染能力绝了!精准搞定复杂字体排版,硬刚字节OpenAI

eric 2025年8月6日 23:49:15 人工智能 7

智东西

作者 | 陈骏达

编辑 | 李水青

国产SOTA(最佳表现)级开源图像生成模型,来了!

智东西8月5日报道,今天,阿里开源了Qwen-Image,通义千问系列中首个图像生成基础模型。Qwen-Image主打复杂文本渲染能力,能在不同场景中,准确地生成不同语种、风格的文字,甚至可以写毛笔字书法,或是直接生成带有文本和图像的PPT页面。

下图中,Qwen-Image不仅准确还原了提示词中的“宫崎骏”风格要求,还随着构图的景深变化,将“云存储”、“云计算”等字样准确地渲染。文字与画面的融合较为自然。

Qwen-Image同样准确生成英文内容。它根据英文提示词生成了一个书店的橱窗场景,所有指定的文字都被准确还原,并且它还自动为每本书生成了不同的风格化字体以及封面,与书名契合。

除了文本处理,Qwen-Image在通用图像生成方面支持了多种艺术风格。从照片级写实场景到印象派绘画,从动漫风格到极简设计都掌握了。

Qwen-Image是一个20B的模型,使用了MMDiT(多模态扩散Transformer)架构,其中“MM”代表的是模型生成图像、文本等多模态内容的能力,“DiT”则代表了这是一个扩散Transformer。

千问团队在多个公开基准上对Qwen-Image进行了评估,比较对象为全球头部的开源、闭源图像生成模型,共获得12项SOTA(最佳表现)。在通用图像生成测试GenEval、DPG和OneIG-Bench,以及图像编辑测试GEdit、ImgEdit和GSO上,Qwen-lmage超过了Flux.1、BAGEL等开源模型、字节跳动的SeedDream 3.0和OpenAI的GPT Image 1(High)。

在用于文本渲染的LongText-Bench、ChineseWord和TextCraft基准测试上的结果表明,Qwen-Image在文本渲染方面表现尤为出色,特别是在中文文本渲染上,大幅领先现有的最先进模型,包括SeedDream 3.0和GPT Image 1(High)。


版权声明

如无特别说明,本站所有文章均为原创。转载请注明来自第一资讯站的eric(网站名称变量、文章作者变量),谢谢合作。

本文地址:http://brief.ericsdemo.xyz/?id=46(文章地址变量)

发布时间:2025-08-06 23:49:15(发布时间变量)

阿里 开源 模型 OpenAI

分享本文
上一篇
苹果或推迟发布18.8英寸折叠设备,搭载类macOS系统
下一篇
微软50周年纪念版Surface Laptop 7亮相,拥有金色Logo、专属壁纸
推荐阅读
OpenAI 推出两款开源模型,性能逼近 o4-mini/o3-mini
OpenAI 推出两款开源模型,性能逼近 o4-mini/o3-mini
直面英伟达!华为宣布CANN全面开源开放 共建昇腾AI生态
直面英伟达!华为宣布CANN全面开源开放 共建昇腾AI生态
OpenAI时隔6年再开源模型,推出两款gpt-oss系列推理大模型
OpenAI时隔6年再开源模型,推出两款gpt-oss系列推理大模型
微软官宣!将开源Windows 11用户界面框架WinUI:分四个阶段
微软官宣!将开源Windows 11用户界面框架WinUI:分四个阶段
发表评论

取消回复

0 条评论
    还没有人评论,快来抢沙发吧~
    热门文章
    • 中国芯片企业卡位“离用户最近”的AI战场

      中国芯片企业卡位“离用户最近”的AI战场

      2025年8月7日 236
    • 初创公司Brilliant Labs推出Halo智能眼镜:能帮你认人记事,$299

      初创公司Brilliant Labs推出Halo智能眼镜:能帮你认人记事,$299

      2025年8月6日 165
    • 苹果iPhone 15:性价比市场中的实力派,值得被更多人喜爱

      苹果iPhone 15:性价比市场中的实力派,值得被更多人喜爱

      2025年8月7日 100
    • OpenAI融资83亿美元,ChatGPT付费用户达500万

      OpenAI融资83亿美元,ChatGPT付费用户达500万

      2025年8月7日 52
    • 最新手机销量排名Top 10:iPhone占据前二,第三名给我看懵了

      最新手机销量排名Top 10:iPhone占据前二,第三名给我看懵了

      2025年8月7日 33
    • iQOO 15再曝,后续还有平板

      iQOO 15再曝,后续还有平板

      2025年8月7日 30
    随机文章
    • 小米汽车磁吸物理按键已接入米家,还可以放在家里使用

      小米汽车磁吸物理按键已接入米家,还可以放在家里使用

      2025年8月6日 6
    • 苹果「脑控」iPad 首次公开演示:四肢瘫痪的他,用一个念头重新拥抱世界

      苹果「脑控」iPad 首次公开演示:四肢瘫痪的他,用一个念头重新拥抱世界

      2025年8月6日 7
    • 微软官宣!将开源Windows 11用户界面框架WinUI:分四个阶段

      微软官宣!将开源Windows 11用户界面框架WinUI:分四个阶段

      2025年8月6日 8
    • 华为放弃高利润,跌价3600元,三折叠屏售价更加亲民了

      华为放弃高利润,跌价3600元,三折叠屏售价更加亲民了

      2025年8月7日 9
    • 谷歌为全美大学生送福利:未来三年投入10亿美元提供AI培训

      谷歌为全美大学生送福利:未来三年投入10亿美元提供AI培训

      2025年8月7日 30
    • 华为化身“价格屠夫”,16GB+1TB跌价2000元,售价更加亲民了

      华为化身“价格屠夫”,16GB+1TB跌价2000元,售价更加亲民了

      2025年8月7日 18
    • 关于我们
    • 联系我们
    • 广告合作
    Copyright Erics主题 All rights reserved ICP备12345678号
    Powered By Z-BlogPHP. Theme By Erics.