Midjourney, Stable XL, Dall.E-3文生图三强效果对比

AI文生图的大争之世，各种文生图的模型此起彼伏，博眼球的更是不在少数。不过目前生成效果最好的依然还是老牌的三强，Midjourney, Stable Diffusion XL，以及Dall.E -3。

我们先来对比一下这三强生成的效果，希望可以为大家在选择图文模型提供一些参考。其他的模型只能说暂时略逊一筹，我们的文心一格4.0大模型的效果赶超很明显，已经可以初步商用了。

废话不说，正片开始。

Table of Contents

1. 图片生成效果对比

PK 1: 生成要求：“一对老夫妻携手迎面走在乡间小路上，画面温馨，皮克斯动画风格, 暖色调”。

PK 2: 生成要求：“生成圣诞电商大促活动的热闹宣传图，红色调，凸显大促，圣诞老人，喜庆”。

PK 3: 生成要求：“生成开屏图片，AI的未来世界，方便人们的生活，充满科技感，高级感”。

PK 4: 生成要求：“生成一个logo，圆形，有质感，主题为“星辰大海”，蓝色系”。

我们可以看到三大模型针对不同的场景生成的效果也是各有千秋， Midjourney各场景都比较均衡，Stable Diffusion XL的效果更加丰富，但是在logo等处理上效果不佳。Dall.E 3的效果更加生动，logo的处理也不错，并且对于中文效果的解析也还不错，不过在想象力方面略逊一筹。

2. 5分钟通过API接入三大模型

第一步，注册日月摘星，获取API Key，注册地址: 日月摘星官网, 注册认证还送6.66。

第二部，调用模型生成接口，自由选择您所需要的模型。

https://api.riyuexinzhu.com/images/models/{model_name}/generate

目前支持的模型列表（model_name）如下所示：

模型名称	制作方	说明
dall-e	OpenAI	dall-e-2调用简洁，对中文识别度较好
dall-e-3	OpenAI	dall-e-3 生成效果大幅度提升，堪比midjourney
midjourney	Midjourney	生成效果好，得过大奖的就是它了，可以指定不同画家，不同风格。中文兼容度不佳，仅提供VIP用户调用
stable-diffusion-512-v2-1	StableAI	StabeAI的标准模型，效果略差，需要增加步长提升效果。中文兼容度不佳。支持图片大小 262,144<=height * width <=1,048,576, height, width都需要为64的倍数，最小128
stable-diffusion-xl-1024-v1-0	StableAI	增强版模型，效果可以与Midjourney一拼。中文兼容度不佳。支持的图片大小为1024×1024, 1152×896, 1216×832, 1344×768, 1536×640, 640×1536, 768×1344, 832×1216, 896×1152

具体的调用示例如下：

https://api.riyuexinzhu.com/images/models/stable-diffusion-xl-1024-v1-0/generate

body入参:

 {
	'text': '一对老夫妻携手迎面走在乡间小路上，画面温馨，皮克斯动画风格, 暖色调',
	'options': {
		'return_mode': 'url'
	},
}

更多API接口内容欢迎您查看: 日月摘星接口文档。

无需东奔西走，日月摘星统一API接口助您5分钟接入AI新时代！

文章出处登录后可见！

已经登录？立即刷新

Midjourney, Stable XL, Dall.E-3文生图三强效果对比

1. 图片生成效果对比

2. 5分钟通过API接入三大模型

相关推荐