千问发布最新图像模型Qwen-Image-2.0

发表于 3 小时前 | 显示全部楼层 |阅读模式
63 0
科技日报记者 崔爽
2月10日,阿里巴巴正式发布新一代图像生成及编辑模型Qwen-Image-2.0。
据介绍,作为千问大模型的图像生成模型底座,Qwen-Image-2.0集生图和编辑于一体,在AI Arena文生图评测中获得1029分,超过Seedream4.5、Flux2-Max等模型。Qwen-Image-2.0支持1K token(词元)的超长文字输入和2K高分辨率,可准确渲染复杂指令,生成专业的PPT及信息图;同时,千问新模型拥有中文汉字渲染能力,数百字的古文全文几乎都能完全渲染在图片中。
fPy4ycTOoYO1eTHe.jpg


值得一提的是,Qwen-Image-2.0首次将图像生成和编辑统一到一个模型中去,以更轻量的模型架构,实现生图和改图性能的大幅提升。
在中文汉字渲染方面,Qwen-Image-2.0表现突出,不但可以以多种字体准确渲染汉字,而且写得又多又准。千问新模型将输入提示词扩展到1K token,可详尽描述任务,实现更专业的文字渲染,生成专业PPT、高级海报、多格漫画等复杂图片,比如以小楷字体几近完全渲染《兰亭集序》数百字的全文配图,以自然语言生成论文格式配图的复杂PPT等。
wdi1tvIHY1V166Dv.jpg


基于Qwen-Image-2.0模型,用户可与AI协同创作出更丰富、实用的图片,比如一句话生成宫保鸡丁的做法流程图等。用户也可上传数张图片进行编辑,生成诸如九宫格多手势自拍、双人AI合影等。
据了解,阿里云百炼上已开通API(应用程序接口)邀测,开发者也可通过Qwen Chat免费体验新模型。
(Qwen-Image-2.0生图)
全部评论

暂无评论,期待您打破宁静

您需要登录后才可以回帖 登录 | 立即注册
发表评论
发布 联系QQ