跳到主要内容

🖼️ 图片提示词

从文本到图像的提示工程,比如 DALLE 和 Stable Diffusion!

🟢 介绍

如何找到最佳的提示词来生成完美的图片是一项特殊的挑战。与文本提示相比,研究如何做到这一点的方法并没有那么成熟。这可能是因为创建对象自身的挑战,这些对象基本上是主观的并且往往缺乏良好的准确性度量方法。但不要担心,社区(@parsons2022dalleprompt)已经对如何提示各种图像模型(@rombach2021highresolution)(@ramesh2022hierarchical)有了很大的进展。

🟢 样式修饰符

样式修饰符是一些能够产生特定样式的描述符(例如,“带有红色色调”、“玻璃制成”、“用 Unity 渲染”)(@oppenlaender2022taxonomy)。它们可以组合在一起,产生更具体的样式。它们可以“包括关于艺术时期、流派和风格,以及艺术材料和媒介、技术和艺术家(@oppenlaender2022taxonomy)”的信息。

🟢 加权

一些模型(如 Stable Diffusion、Midjourney 等)允许你对提示中的词语进行加权。这可以用于强调生成图片中的某些词语或短语。它还可以用于减弱生成的图片中某些词语或短语的影响。让我们考虑一个简单的例子:

🟢 修复变形生成

变形生成在许多模型中都是一个常见问题,特别是在人体部位(如手、脚)上。通过良好的反向提示语(@blake2022with),可以在一定程度上解决这个问题。以下示例来自于这篇Reddit帖子。