🟢 介绍
如何找到最佳的提示词来生成完美的图片是一项特殊的挑战。与文本提示相比,研究如何做到这一点的方法并没有那么成熟。这可能是因为创建对象自身的挑战,这些对象基本上是主观的并且往往缺乏良好的准确性度量方法。但不要担心,社区(@parsons2022dalleprompt)已经对如何提示各种图像模型(@rombach2021highresolution)(@ramesh2022hierarchical)有了很大的进展。
🟢 样式修饰符
样式修饰符是一些能够产生特定样式的描述符(例如,“带有红色色调”、“玻璃制成”、“用 Unity 渲染”)(@oppenlaender2022taxonomy)。它们可以组合在一起,产生更具体的样式。它们可以“包括关于艺术时期、流派和风格,以及艺术材料和媒介、技术和艺术家(@oppenlaender2022taxonomy)”的信息。
🟢 质量增强器
“Quality boosters”(@oppenlaender2022taxonomy)是添加到提示中以提高生成图像的某些非特定样式质量的术语。例如,“amazing”、“beautiful”和“good quality”都是质量增强器,可以用于改善生成图像的质量。
🟢 重复
在提示中重复相同的词语或者类似短语会导致模型在生成的图片中强调该词语。例如,@Phillip Isola 使用 DALLE 生成了这些瀑布:
🟢 加权
一些模型(如 Stable Diffusion、Midjourney 等)允许你对提示中的词语进行加权。这可以用于强调生成图片中的某些词语或短语。它还可以用于减弱生成的图片中某些词语或短语的影响。让我们考虑一个简单的例子:
🟢 修复变形生成
变形生成在许多模型中都是一个常见问题,特别是在人体部位(如手、脚)上。通过良好的反向提示语(@blake2022with),可以在一定程度上解决这个问题。以下示例来自于这篇Reddit帖子。
🟢 Midjourney
Midjourney 是另一个 AI 图像生成器。与 Stable Diffusion 不同,Midjourney 使用 Discord Bot 作为 AI 图像生成的接口
🟢 资源
图像提示工程领域非常多样化。以下是一份涵盖了其中部分内容的资源清单。