首页>AI资讯>Stable Diffusion XL 1.0再次升级，出图效果不输Midjourney

Stable Diffusion XL 1.0再次升级，出图效果不输Midjourney

发布时间：2023-07-28 09:07:07 浏览量：498

导语：Stable Diffusion最新版XL1.0正式开源。这个版本解决了AI人物模型，出图效果相当于Midjourney5.0。而且，它可以在几秒钟内生成高达100万像素的高质量图像，也是写实照片的最佳开放模型。

与之前版本相比，SDXL1.0提供了更鲜艳、更准确的色彩输出。它还改进了对比度、光照、阴影和生图速度。此外，它还具有3.5B参数基础模型和6.6B参数模型集成管道，支持图像修复、扩展和微调。用户只需添加简短的文本提示，就可以精细控制图片变化。您可以通过FREE、Ai API、Github、Clipdrop和DreamStudio应用程序进行体验。

在大模型开启的 AIGC 时代，由明星 AI 初创公司 Stability AI 打造的文本到图像生成模型 Stable Diffusion 可谓风靡全球。

虽然从文本到图像的生成模型并不少，但 Stable Diffusion 是最受欢迎的开源模型。各路开发者也基于 Stable Diffusion 模型进行二创，推出各种各样、花式繁多的 AIGC 应用。

刚刚，Stability AI 正式推出了 Stable Diffusion XL（SDXL）1.0。文本到图像生成模型，又完成了进化过程中的一次重要迭代。

这是 Stability AI 最新的旗舰图像模型，也是当前图像生成领域最好的开源模型。

在 SDXL 1.0 版本发布之前，Stability AI 在六月份推出的 SDXL 0.9 仅作研究用途。但从今天起，SDXL 1.0 将通过 Stability AI 的 API 开源开放给开发者，普通人也可以通过消费级应用 Clipdrop 和 DreamStudio 访问。

此外，鉴于与亚马逊的密切合作关系，SDXL 1.0 已经登陆亚马逊云科技的基础模型托管服务 Amazon Bedrock，而且还会登陆 Amazon SageMaker JumpStart。

SDXL 1.0，什么进化了？

1. 生成概念与风格更具挑战的作品

SDXL 1.0 几乎能够生成任何艺术风格的高质量图像，并且是实现逼真效果的最佳开源模型。用户可以在没有任何特定的「灵感」的情况下进行提示，确保风格的绝对自由，生成各具特色的图像。SDXL 1.0 在色彩的鲜艳度和准确度方面做了很好的调整，对比度、光线和阴影都比上一代更好，并全部采用原生 1024x1024 分辨率。

除此之外，SDXL 1.0 可以生成图像模型难以渲染的概念，例如手、文本以及空间的排列。

2. 语言更简洁、更智能

SDXL 1.0 只需几句话就能创建复杂、细致、美观的图像。用户不再需要用华丽的辞藻进行修饰就能够获得想要的高质量图像。

它甚至能够区分「The Red Square」（红场，一个著名景点）和「red square」（红色正方形）。

除此之外，SDXL 1.0 可以生成图像模型难以渲染的概念，例如手、文本以及空间的排列。

2. 语言更简洁、更智能

SDXL 1.0 只需几句话就能创建复杂、细致、美观的图像。用户不再需要用华丽的辞藻进行修饰就能够获得想要的高质量图像。

它甚至能够区分「The Red Square」（红场，一个著名景点）和「red square」（红色正方形）。

3. 微调和高级控制

有了 SDXL 1.0 ，根据自定义数据对模型进行微调比以往任何时候都要容易。可生成自定义 LoRA 或检查点，减少数据处理的需要。Stability AI 正在利用专门用于 SDXL 的 T2I / ControlNet 构建下一代任务特定结构、样式和组成控制。这些功能目前处于测试预览阶段，可以随时关注微调的更新。SDXL 1.0 上的图像控制也即将推出。

自 4 月 13 日发布 SDXL beta 版本以来，ClipDrop 用户已经使用该模型生成超过 3500 万张图片，而 Stability AI 的 Discord 社区平均每天生成 2 万张图片。

网友制作了 SDXL 0.9 与 SDXL 1.0 的对比图，左边为 SDXL 0.9 生成图像，右边为 SDXL 1.0 生成图像。可以明显看出二者对于色彩运用的差距。SDXL 1.0 的色彩更加丰富且真实，光效表现也更加出色。

SDXL 1.0 也是所有开放式图像模型中参数量最多的模型之一，它建立在一个创新的新架构上，由一个 35 亿参数的基础模型和一个 66 亿参数的细化模型组成。

完整模型包括一个用于潜在扩散的专家混合管道：第一步，基础模型生成（噪声）潜在变量，然后用专门用于最终去噪步骤的细化模型对其进行进一步处理。

基础模型也可以作为独立模块使用。细化模型为基础模型的输出添加更精确的颜色、更高的对比度和更精细的细节。

这种两阶段架构可确保图像生成的稳健性，而且不会影响速度或需要过多的计算资源。SDXL 1.0 可在配备 8GB VRAM 的消费级 GPU 或随时可用的云实例上有效运行。

上一篇：OpenAI创始人奥特曼，启动“世界币”项目

下一篇：伦敦帝国理工学院和DeepMind联合设计AI框架统一强化学习智能体

声明： 本站所有文章，如无特殊说明或标注，均为网友发布。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。