第一资讯站

  • 首页
  • 手机数码
    • 苹果手机
    • 华为手机
    • 小米手机
  • 人工智能
  • 智能制造
  • 游戏电竞
登录 | 注册
  1. 首页
  2. 人工智能
  3. 正文

阿里开源图像大模型,实测中文渲染能力绝了!精准搞定复杂字体排版,硬刚字节OpenAI

eric 2025年8月6日 23:49:15 人工智能 21

智东西

作者 | 陈骏达

编辑 | 李水青

国产SOTA(最佳表现)级开源图像生成模型,来了!

智东西8月5日报道,今天,阿里开源了Qwen-Image,通义千问系列中首个图像生成基础模型。Qwen-Image主打复杂文本渲染能力,能在不同场景中,准确地生成不同语种、风格的文字,甚至可以写毛笔字书法,或是直接生成带有文本和图像的PPT页面。

下图中,Qwen-Image不仅准确还原了提示词中的“宫崎骏”风格要求,还随着构图的景深变化,将“云存储”、“云计算”等字样准确地渲染。文字与画面的融合较为自然。

Qwen-Image同样准确生成英文内容。它根据英文提示词生成了一个书店的橱窗场景,所有指定的文字都被准确还原,并且它还自动为每本书生成了不同的风格化字体以及封面,与书名契合。

除了文本处理,Qwen-Image在通用图像生成方面支持了多种艺术风格。从照片级写实场景到印象派绘画,从动漫风格到极简设计都掌握了。

Qwen-Image是一个20B的模型,使用了MMDiT(多模态扩散Transformer)架构,其中“MM”代表的是模型生成图像、文本等多模态内容的能力,“DiT”则代表了这是一个扩散Transformer。

千问团队在多个公开基准上对Qwen-Image进行了评估,比较对象为全球头部的开源、闭源图像生成模型,共获得12项SOTA(最佳表现)。在通用图像生成测试GenEval、DPG和OneIG-Bench,以及图像编辑测试GEdit、ImgEdit和GSO上,Qwen-lmage超过了Flux.1、BAGEL等开源模型、字节跳动的SeedDream 3.0和OpenAI的GPT Image 1(High)。

在用于文本渲染的LongText-Bench、ChineseWord和TextCraft基准测试上的结果表明,Qwen-Image在文本渲染方面表现尤为出色,特别是在中文文本渲染上,大幅领先现有的最先进模型,包括SeedDream 3.0和GPT Image 1(High)。


版权声明

如无特别说明,本站所有文章均为原创。转载请注明来自第一资讯站的eric(网站名称变量、文章作者变量),谢谢合作。

本文地址:http://brief.ericsdemo.xyz/?id=46(文章地址变量)

发布时间:2025-08-06 23:49:15(发布时间变量)

阿里 开源 模型 OpenAI

分享本文
上一篇
苹果或推迟发布18.8英寸折叠设备,搭载类macOS系统
下一篇
微软50周年纪念版Surface Laptop 7亮相,拥有金色Logo、专属壁纸
推荐阅读
OpenAI 推出两款开源模型,性能逼近 o4-mini/o3-mini
OpenAI 推出两款开源模型,性能逼近 o4-mini/o3-mini
谷歌Gemini推出“Storybook”:可根据描述生成10页图文故事书
谷歌Gemini推出“Storybook”:可根据描述生成10页图文故事书
初创公司Brilliant Labs推出Halo智能眼镜:能帮你认人记事,$299
初创公司Brilliant Labs推出Halo智能眼镜:能帮你认人记事,$299
OpenAI时隔6年再开源模型,推出两款gpt-oss系列推理大模型
OpenAI时隔6年再开源模型,推出两款gpt-oss系列推理大模型
发表评论

取消回复

0 条评论
    还没有人评论,快来抢沙发吧~
    热门文章
    • 中国芯片企业卡位“离用户最近”的AI战场

      中国芯片企业卡位“离用户最近”的AI战场

      2025年8月7日 252
    • 初创公司Brilliant Labs推出Halo智能眼镜:能帮你认人记事,$299

      初创公司Brilliant Labs推出Halo智能眼镜:能帮你认人记事,$299

      2025年8月6日 183
    • 苹果iPhone 15:性价比市场中的实力派,值得被更多人喜爱

      苹果iPhone 15:性价比市场中的实力派,值得被更多人喜爱

      2025年8月7日 115
    • OpenAI融资83亿美元,ChatGPT付费用户达500万

      OpenAI融资83亿美元,ChatGPT付费用户达500万

      2025年8月7日 66
    • 最新手机销量排名Top 10:iPhone占据前二,第三名给我看懵了

      最新手机销量排名Top 10:iPhone占据前二,第三名给我看懵了

      2025年8月7日 46
    • iQOO 15再曝,后续还有平板

      iQOO 15再曝,后续还有平板

      2025年8月7日 45
    随机文章
    • Doogee S200 Max三防手机发布:双闪、四摄、副屏、22000mAh电池

      Doogee S200 Max三防手机发布:双闪、四摄、副屏、22000mAh电池

      2025年8月7日 22
    • 大疆回应旗下首款全景相机 Osmo 360“镜头起雾”

      大疆回应旗下首款全景相机 Osmo 360“镜头起雾”

      2025年8月6日 20
    • 阿里开源图像大模型,实测中文渲染能力绝了!精准搞定复杂字体排版,硬刚字节OpenAI

      阿里开源图像大模型,实测中文渲染能力绝了!精准搞定复杂字体排版,硬刚字节OpenAI

      2025年8月6日 21
    • 保姆机器人售价将下降,基础款五年内有望普及家庭

      保姆机器人售价将下降,基础款五年内有望普及家庭

      2025年8月6日 18
    • 初创公司Brilliant Labs推出Halo智能眼镜:能帮你认人记事,$299

      初创公司Brilliant Labs推出Halo智能眼镜:能帮你认人记事,$299

      2025年8月6日 183
    • 论高刷屏还是天马最灵!多款高刷产品亮相2025ChinaJoy天马展台

      论高刷屏还是天马最灵!多款高刷产品亮相2025ChinaJoy天马展台

      2025年8月6日 19
    • 关于我们
    • 联系我们
    • 广告合作
    Copyright Erics主题 All rights reserved ICP备12345678号
    Powered By Z-BlogPHP. Theme By Erics.