阿里开源图像大模型,实测中文渲染能力绝了!精准搞定复杂字体排版,硬刚字节OpenAI
智东西作者 | 陈骏达编辑 | 李水青国产SOTA(最佳表现)级开源图像生成模型,来了!智东西8月5日报道,今天,阿里开源了Qwen-Image,通义千问系列中首个图像生成基础模型。Qwen-Image主打复杂文本渲染能力,能在不同场景中,准确地生成不同语种、风格的文字,甚至可以写毛笔字书法,或是直接生成带有文本和图像的PPT页面。下图中,Qwen-Image不仅准确还原了提示词中的“宫崎骏”风格
2025年8月6日