本文介绍如何部署Stable Diffusion WebUI工具前端和Stable Diffusion训练模型,实现高质量AI图片生成,掌握整个AI作画推理流程及关键参数对图片输出的影响。
AIGC(AI generated content)是一种利用AI技术自动生成内容的生产方式,代表着AI从理解语言、理解文字、理解图片和视频,走向了生成内容,是一种‘人机共创’新模式。
请参考通过向导购买实例创建一台符合以下条件的实例:
https://www.python.org/ftp/python/3.11.3/Python-3.11.3.tgz
。apt update apt -y upgrade wget https://www.python.org/ftp/python/3.11.3/Python-3.11.3.tgz tar -zxvf Python-3.11.3.tgz cd Python-3.11.3/ ./configure --prefix=/usr/local/python3.11.3 make && make install
cd apt install python3-pip
pip --version
命令,回显如下,表示安装成功。apt -y install git
git --version
命令,回显如下,表示安装成功。nvidia-smi
命令,可以看到GPU驱动的版本,说明GPU驱动已安装成功。/usr/local/cuda/bin/nvcc -V
命令可以看到CUDA版本,说明CUDA已安装成功。执行以下命令,安装Stable Diffusion UI。
cd git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git
回显如下,表示下载成功。
登录Stable Diffusion代码库,单击“Files and versions”页签。
右键单击“sd-v1-4.ckpt”训练模型,复制下载链接地址,本例为https://huggingface.co/CompVis/stable-diffusion-v-1-4-original/blob/main/sd-v1-4.ckpt
。
依次执行以下命令,进入训练模型存放目录并下载。
cd stable-diffusion-webui/models/Stable-diffusion/ wget https://huggingface.co/CompVis/stable-diffusion-v-1-4-original/blob/main/sd-v1-4.ckpt
执行以下命令,进入训练模型webui目录。cd & cd stable-diffusion-webui/
执行以下命令,添加清华源。
vi launch_utils.py
命令。run(f'"{python}" -m {torch_command}
,并添加清华源-i https://pypi.tuna.tsinghua.edu.cn/simple
。return run(f'"{python}" -m pip {command}
,并添加清华源-i https://pypi.tuna.tsinghua.edu.cn/simple
。依次执行以下命令,进入并启动python-venv虚拟环境。
apt -y install python3.8-venv python3 -m venv venv_name source venv_name/bin/activate
回显如下,表示成功进入虚拟环境。
执行以下命令,安装gfpgan。
git clone https://github.com/TencentARC/GFPGAN.git pip install gfpgan
依次执行以下命令,运行webui.sh
文件。./webui.sh --share -f
根据网速不同,大约需要20分钟 - 2个小时不等,请耐心等待,一定不要关闭远程连接窗口。如果过程中出现运行失败的情况,请稍后重试或按需解决。
回显如下,表示下载完成。
使用浏览器打开http://127.0.0.1:7860,注意不要关闭远程连接窗口。
参数 | 说明 | 取值示例 |
---|---|---|
Sampling Steps | AI推理的步数,步数越多画面中的细节就越多,需要的时间也就越久,一般设置20~30。 | 20 |
Sampling method | AI推演的算法,一般可以选择Euler a、Euler 、DDIM。 | Euler a |
图片分辨率 | 取决于显卡,低于512 X 512画面不会有太多细节。 | 512*512 |
扩展选项 |
| 不配置 |
Batch count | 运行次数。 | 1 |
Batch size | 同时生成图片的张数。 | 1 |
CFG Scale | 设置的越高,AI越严格按照设定生成图片,但也会有越少的创意;设置的越低,AI就会有更多的创意。一般设置为7左右。 | 7 |
Seed | 生成每张图片时的随机种子,作为确定扩散初始状态的基础,一般保持默认。 | -1 |