TA的每日心情 | 慵懒 7 天前 |
---|
签到天数: 55 天 [LV.5]常住居民I
|
马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。
您需要 登录 才可以下载或查看,没有账号?立即注册
×
Stable Diffusion秋叶整合包V4.9
Stable Diffusion是一种深度学习模型,于2022年发布,由创业公司Stability AI与多个学术研究者和非营利组织合作开发。它采用了潜在扩散模型,现已开源其源代码和模型,由全球开发人员共同维护于Github上,AUTOMATIC1111维护了一个完整项目。由于Stable Diffusion的完整版需要满足网络的需求,国内多位开发者制作了不同版本的封装包,开源社区为其普及化做出了难以磨灭的贡献。
Stable Diffusion最大的特点在于其开源性,可以在配备至少8GB显存的适度GPU的大多数消费级硬件上离线运行。笔者建议显存线至少为8G。
由于AI训练和产出本质上是软硬件结合的深度学习原理,因此常常使用英伟达公司的显卡及其相关技术,比如CUDA、CUDNN和一些深度学习组件如xformer和pytorch。对学习AI的进阶非常重要,但这些要求大量的额外编程知识,容易让新手感到困难。
本文以及秋叶包都将避免这些内容,使得它们更容易理解和部署,相对于原版来说更加易于操作。
Stable Diffusion基本概念
大模型:
通过使用素材和SD低模生成的深度学习大模型,可以直接应用于生成图像。大模型是创作的核心素材,决定了最终作品的方向和风格。这些大模型的扩展名一般为CKPT或SAFETENSORS。建议使用至少8GB显存的GPU进行操作。
VAE:
VAE是对大模型的补充,类似于滤镜,可以稳定画面的色彩范围,提高作品的美观度。VAE的扩展名一般为CKPT或SAFETENSORS。建议使用不低于8GB显存的GPU进行操作。
LoRA:
LoRA是一种模型插件,需要在基于某个大模型的基础上进行深度学习后生成小型模型。需要与大模型配合使用,可以在涵盖中小范围内的风格上产生影响或增加大模型缺失的元素。如果基于SD低模生成,则在不同大模型之间更换使用时具有更好的通用性和适用性。LoRA的扩展名一般为CKPT或SAFETENSORS。
ControlNet:
ControlNet是一个神级插件,让SD具备了分析图片中线条和景深等信息的能力,并反推到处理图片上。这对于创作出真正自然、真实的图像非常有用。
Stable Diffusion Web-UI(SD-WEBUI): SD-WEBUI是使用Stability AI算法制作的开源软件,可以通过浏览器操作SD。这个开源软件不仅插件齐全、易于使用,而且可以随时得到更新和支持。SD-WEBUI运行环境基于Python,因此需要一定的编程知识进行操作。
|
|