再也不用担心 AI 图片脸崩手崩了

如果你经常用 Stable Diffusion 画人物，相信你一定画出过脸崩的图片。这也是目前文生图 AI 工具普遍存在的问题。连 Midjourney V6 也不例外！当它画一个人的时候表现还好，当画面里的人一多，局面就难以控制了。

看，这就是 Midjourney V6 生成的图片。放大瞧瞧， 各种扭曲变形，是不是令人大跌眼镜？

Midjourney group girls

单人肖像在 Stable Diffusion 中可以局部重绘一下，要是人数多呢？值得我们为修复一张图片花费几个小时的时间吗？幸运的是，我将为你介绍一个非常强大的插件。它就是为一次性快速修复这样的问题准备的。绝对是 Stable Diffusion 必装的一款插件。

很多人没有用过 Stable Diffusion 的原因是显卡不给力。其实可以租用云平台来跑 SD，按小时收费也很划算。感兴趣的话，可以看看我的这篇文章：

👉 玩 Stable Diffusion 没有好显卡？试试秋叶大佬推荐的云平台

ADetailer 值得我花很多时间，与你们分享。本文包含的内容非常丰富，从插件的安装，到各种参数的详细介绍。耐心看完的话，一定能成为高级玩家。OK，让我们开始吧。

本文对应的B站视频讲解链接：

👉 www.bilibili.com/video/BV1fK…

安装

首先我们来看如何安装这个插件。

安装 ADetailer 的方法和安装其他插件一样。首先来到插件的标签页，然后点击“可用”标签页。接着在 “Search” 文本框内输入 “adetailer”。通常情况下，它会出现在下方的列表里，然后点击安装即可。

如果没有出现的话，还有第二种方法，那就是利用“可用”标签页右边的标签页“从网址安装”。这个网址可以从这个项目的 Github 网页获得。我们可以在搜索引擎上输入关键词 “adetailer stable diffusion”，通常这个网页在搜索结果中排名第一。或者直接在浏览器地址栏输入网址。

到了 Github 网页(github.com/Bing-su/ade…)以后，点击 “Code” 按钮，在弹出的窗口中点击 “复制url到剪贴板”按钮。这时候网址就被复制到了剪贴板上。

ADetailer 的 GitHub 页面里详细介绍了安装过程和解决问题的方案。大家也可以仔细去看一下。某些模型可能需要单独下载并移动到 "webui/models/adetailer "文件夹。

复制网址后，让我们回到 WebUI，把网址粘贴进来，然后点击“安装”按钮。

切换到“已安装”的标签页，点击“应用并重启用户界面”。

extension list

接着回到 WebUI 文生图或图生图的界面，就可以看见 ADetailer 出现在列表中啦。

adetailer in webui

演示操作

安装完成以后，我们就可以体验它神奇的效果啦。

首先，我在不用这个插件的情况下，生成一张图。这里使用的是文生图，当然，ADetailer 也可以在图生图中发挥作用。

这里我使用的是真实系模型 MajicmixRealistic 。大家可以根据自己的喜好选择相应的模型。其中的很多参数我遵循了模型作者的推荐，比如 Clip skip 我设置的是 “2”，采样器我选择的是 “Euler a”。

不出意外的话，生成的照片是有很多问题的。

00000-222357305-原图

最前面的女孩还好，但后排女生的脸就开始出问题了。画面中越远或者越小的人脸越容易出问题。这么多脸要是用局部重绘一个个去修复的话，肯定得累死。

感谢 ADetailer 的作者为我们提供解决方案。

接下来我们固定一下随机种子。然后展开下方的插件 ADetailer 。我们发现这里有好多模型可供选择，令人眼花缭乱。我们就先来一个默认的，其他的模型我稍后会做讲解。勾选这个插件以后，然后重新生成。

adetailer interface

我们通过预览窗口会发现，生成图像的过程变得不一样了。几乎每张脸的周围都多了一个红色的方框，上面还有数字。

adetailer processing

还能在预览窗口中看到每张脸的特写。这实际上是 ADetailer 插件正在处理一个个人脸。

处理完成之后，图片就出来了。仔细看看，这些人脸是不是改善很多呢。

face-v8n

让我们回过头来看看原图。这是原图。

00000-222357305-原图

如果看不出来区别的话，我为你做了一张放大后的对比图。仔细看的话，远处的人脸也被一一修复了呢。

comparison 1

模型解释和对比

为了生成刚才的图片，我们无脑选择了默认的模型，也就是 face yolo v8n。实际上，ADetailer 为我们提供了相当多的模型。我数了一下，目前竟然有 14 个之多。

adetailer models

看到这么多模型，是不是会犯选择困难症呢？没关系，让我来为大家讲解它们的区别。然后再展示它们生成的对比图。理性加感性，这样就没问题啦。

从处理图像的区域来划分，这些模型分为三类。模型名称里包含 face 的就是用来处理面部的。包含 hand 就是处理手的。包含 person 就是处理身体的。deepfashion 比较特殊，我们先不讲。

从处理图像使用的模型划分，这些模型分为两类。模型名称里包含 YOLO 的就是使用了 YOLO 算法。包含 MediaPipe 就是使用了 MediaPipe 算法。

目前 ADetailer 所有的 MediaPipe 模型都是用来处理面部的，尽管 MediaPipe 本身还可以处理手。

MediaPipe 提供专门的人脸检测模型，并对性能和准确性进行了优化。YOLO 算法则更具有通用性，它可以检测各种物体。在 ADetailer 中，它还可以检测身体，还适用于二次元的模型。MediaPipe 则适用于写实模型。

yolo vs mediapipe

和YOLO相比，它可能会对人脸特征提供更高的准确性，而 YOLO 的准确性取决于其训练和版本。

图中的方框就是它们处理的区域。从图片里也可以看出来，MediaPipe 处理的区域更小，但更精确。它在处理过程中对面部多个特征都做了标注。

但它也有缺点。如果是侧脸，或者脸部在画面占比小的话，MediaPipe 就无法处理。因此它能处理的面部是非常有限的。YOLO 则能一次处理大量的人脸。从图片里也可以看出，YOLO 处理的区域更大，甚至能处理头发和背景。

为了便于大家记忆，我做了一张表格。

yolo vs mediapipe 表格

接下来我们分开来解释 YOLO 和 MediaPipe。

目前基于 YOLO 的模型有 10 个。基本都以".pt" 结尾，这个是文件类型，不用管它。

文件名中的数字代表版本。目前是第 8 个版本。版本号后面跟着的字母"s"、"n"和"m" 代表模型的大小。"s"代表小型 small，"n"代表纳米 nano，比小型更小。"m"代表中型 medium。模型越小，处理速度越快，代价就是精度更低。大家可以考虑速度和精度来选择相应的型号。

根据我的解释，"v8n"和"v8m"应该是YOLO系里面差异最大的两个模型。让我们看看它们的对比图。

yolo v8n vs yolo v8m

细看之下，差异也挺明显的。"v8m"比"v8n"看上去细节更好。

接下来我们聊一下 MediaPipe，分为 4 个版本，分别是"full"、"short"、"mesh"和"mesh_eyes_only"。

mediapipe models

为了让大家更直观地理解，我把 MediaPipe 这几个模型出图的过程放在一起，做了一张对比图。

mediapipe models comparison

先来看上半部份，full和short的区别。顾名思义，full就是完整的意思，而short就是短小精悍。full 模型对面部的检测更全面。蓝色的点就是模型检测到的面部特征，full 对最右边女生的面部检测点比 short 要多。同时，full 检测到了 3 张人脸，而 short 只检测到了最右边女生的脸。

mesh 就是网的意思，顾名思义，它会把面部标记为一个网，因此对面部的检测更全面和立体。它更善于分析面部表情。mesh_eyes 则只检测眼睛的部分，适合对眼睛做更精细的修复。

大家对比下，mesh 处理后的面部是不是比 full 更有立体感，更精细呢。

mediapipe full vs mesh