
Stability AI 公司昨日(10 月 22 日)发布博文,Stable Diffusion 3.5闪亮登场,这标志着开源 AI 文生图模型的重大进步!

本次开源一共发布Large、Large Turbo和Medium三个版本,可根据不同的商业环境提供高度定制功能,同时对这些模型进行了大幅度优化可在消费级GPU就能轻松推理运行。
Stable Diffusion 3.5 Large:该基础模型拥有 80 亿参数,性能优于竞品模型并且响应迅速,是 Stable Diffusion 系列中最强大的模型。该模型非常适合 1 百万像素分辨率的专业用例。 Stable Diffusion 3.5 Large Turbo:该模型是 Stable Diffusion 3.5 Large 的蒸馏版本,只需四步即可生成高质量图像,速度远快于Stable Diffusion 3.5 Large。
Stable Diffusion 3.5 Medium:该模型拥有 25亿参数,采用改进的MMDiT-X架构和训练方法,可在消费级硬件上「开箱即用」,在质量和定制易用性之间实现了平衡。该模型能够生成分辨率在0.25到2百万像素之间的图像。
StableDiffusion 3.5 Large模型拥有80亿参数,提供了卓越的图片质量和高度文本语义还原,是Stable Diffusion家族中最强大的模型,非常适合专业使用,尤其是在100万像素分辨率的图片。

据介绍,Stable Diffusion 3.5各版本模型在以下多个方面表现出色:
可定制性:轻松微调模型以满足特定创作需求,或根据定制的工作流程构建应用程序。
高效性能:经过优化,均可在标准消费级硬件上运行,尤其是 Stable Diffusion 3.5 Medium 和 Stable Diffusion 3.5 Large Turbo 型号。 多样化输出:无需大量提示,即可创建代表全世界的图像,而不仅仅是一种肤色和特征的人。
风格多样:能够生成各种风格和美感的图片,如 3D、摄影、绘画、线条艺术以及几乎任何可以想象到的视觉风格。


Stable Diffusion 3.5凭借其出色的表现能力,成为市场上最可定制和最易访问的文生图像模型之一,同时在提示遵循性和图像质量方面保持了顶级性能。
Hugging Face:https://huggingface.co/stabilityai
GitHub:https://github.com/Stability-AI/sd3.5