【AI】StabilityAI推出StableDiffusion3.5

前沿科技说 2024-11-02 09:04:12

近日,Stability AI 宣布推出其文生图模型 Stable Diffusion的3.5 版版本。

新版模型包括Medium、Large 和 Large Turbo 三个版本,旨在满足科研人员、爱好者、企业等广泛用户的多元需求。

Stable Diffusion 3.5 Large

Stable Diffusion 3.5 Large 拥有 80 亿个参数,是该系列目前最强的模型,专为对图像质量有严格要求的用户设计。

它能够生成 100 万像素的高清图像,在响应提示词上有更高的精度。

Large 模型非常适用于高分辨率场景,在建筑设计、时尚、广告创意等专业领域中,能实现高质量图像的稳定生成,为创意领域和行业专业人士提供了更多可选性。

Stable Diffusion 3.5 Large Turbo

Stable Diffusion 3.5 Large Turbo 在模型大小和精确度上稍逊于 Large,但在生成速度上表现更加迅速。

它可在 4 步之内完成图像生成,并保持对提示词的良好响应,因此特别适合需要快速生成图像的用户。

Large Turbo 模型的优化使其生成速度和图像质量达到更好的平衡,是初创公司和创意机构的理想选择。

Stable Diffusion 3.5 Medium

预计于 10 月 29 日发布的 Stable Diffusion 3.5 Medium,是模型的精简版,具有 25 亿个参数。

该版本采用 MMDiT-X 架构和改进的训练方法,为消费级硬件优化,使用户在个人电脑上即可以稳定生成高质量图像。

Medium 版本适用于 25 万至 200 万像素的图像生成场景,非常适合个人创意者和中小型团队,尤其是没有强大硬件设备的用户,可以实现更灵活、可定制的图像生成。

开源许可与适用范围

Stability AI 在开放模型使用许可上继续保持灵活的政策。

Stable Diffusion 3.5 可免费用于非商业用途,且年收入低于 100 万美元的小型企业也可免费使用;对于年收入超百万美元的企业,则需申请商业许可。

此外,Stability AI 允许开发者下载模型权重并通过 Hugging Face 等平台自托管模型,使用户能够在本地运行模型,这无疑为需要个性化调整的开发者提供了更多选择。

应用场景与技术进步

Stable Diffusion 3.5 在图像生成技术的精细度上有了显著提升,在图像质量、生成速度、对提示词的准确响应等方面均有优化。

模型能够理解更复杂的提示词结构,因此生成图像的细节更加丰富,特别是在色彩、光影、纹理等方面表现出色。

新模型的推出还进一步完善了分辨率处理能力,用户可以生成超高清的专业图像,这为广告创意、产品设计、时尚领域的高端图像制作带来了新的可能性。

此外,Stable Diffusion 3.5 在创意领域的运用也展示了其强大的潜力。

许多设计师和艺术家可以通过它将概念快速可视化,并且在反复尝试中不断调整细节,使创作过程更加便捷。

同时,模型的中型版本还降低了硬件的门槛,个人和小型团队可以在消费级硬件上获得较高质量的图像输出。

对此,各位读者有什么想说的?

0 阅读:9

前沿科技说

简介:用最接地气的文 字,传递最“好玩”的科技讯息!