AI画像クリエイターが、「プロンプトワードのあいまいな表現による偏りの発生、コントロールが難しい定型化されたエフェクト、パラメータ設定の方向性がない」ことにまだ悩んでいるとき、OpenArtプラットフォームが立ち上げた「Stable Diffusion Prompt Book」(以下、「プロンプトブック」)は、「無料のオープンソース、体系的なガイダンス、ケースベースのティーチング」という3つの核となる利点を備えた、Stable Diffusionユーザーのための「作成マニュアル」となりました。プロンプトブック”(以下 “プロンプトブック”)は、”無料のオープンソース、体系的な指導、ケースベースの指導 “という3つの核となる利点を持ち、安定拡散ユーザーのための “作成マニュアル “となりました。Mohamad Diab (PublicPrompts)と他の業界エキスパートによって書かれたオープンソースのマニュアルとして、Prompt Bookは、基本構文から高度なテクニック、スタイルシソーラスからパラメータ提案まで、「理論-事例-実践」の完全な知識体系を構築し、基礎ゼロのユーザーでも1時間以内にStable Diffusionの「生成」をマスターすることができます。プロンプトブックは、基本構文から高度なテクニック、スタイルシソーラスからパラメータ提案まで、基礎ゼロのユーザーでも1時間以内に「プロ級の画像を生成する」ためのプロンプトのロジックをマスターできる完全知識体系で、AI画像作成のプロの敷居を完全に下げます。
プロンプト・ブック』を一般的なコミュニティ・チュートリアルと差別化する鍵は、「体系化され、再利用可能で、検証可能な」方法論にあります。単なるテクニック集ではなく、実践的で検証可能な「プロンプト・ワード・エンジニアリングへのガイド」です。単なるヒント集ではなく、3つのコア・バリューを通じてAI画像作成のペインポイントを解決する、実証済みの「
キュー・ワード・エンジニアリング・ガイド」なのです:
AI創作の普遍性を促進する」ことを目標に、オープンアートはプロンプトブックを完全に無料のオープンソースリソースとし、技術的な障壁を取り払いました:
- 無制限アクセス: 誰でも登録やログインなしでOpenArtの公式ウェブサイト(https://openart.ai/promptbook)からPDF版をダウンロードでき、オフラインでの閲覧や印刷をサポートし、2025年現在、2022年11月13日更新時点のコアコンテンツの有効性を維持しています;
- オープンソースのコラボレーションと反復:マニュアルのコンテンツは、コミュニティからのフィードバックに基づいて継続的に最適化され、開発者はGitHubなどのプラットフォームを通じて新しいスタイルワードやケースの補足に参加することができ、「クリエイター-エキスパート」の好循環を形成している!例えば、後にコミュニティによって追加された「AIジェネレーティブアート著作権のヒント」の章は、ユーザーの実践的なフィードバックから生まれたものである;
- 多言語化:オリジナルの英語版に加えて、コミュニティが自発的に中国語、日本語、スペイン語など8ヶ国語に翻訳した。
プロンプト・ブックの最も核心的な価値は、「標準化されたプロンプト・ワードの枠組み」を構築することにある:
- 四大要素のプロンプト構造:プロンプト・ブックには「主題、スタイル、詳細、パラメータ」の四大要素が含まれている必要がある。「というプロンプトを生成するには、次のように分解する必要がある:
- 件名:「未来都市、高層ビル、航空交通
- スタイル:「サイバーパンク、ネオンライト、雨で濡れた地面」;
- ディテール:「8K解像度、映画のような光と影、クリアなディテールのテクスチャ」;
- パラメータ:「CFGスケール8、サンプリングステップ20、シード値123456」;
- ウェイトコントロール構文: “()” (ウェイトを1.1倍にする), “[]” (ウェイトを0.9倍にする), “(キーワード: ウェイト値)” (カスタムウェイト)の詳細説明。(ネオンライト: 1.5)」など)は、「(サイバーパンクスタイル: 1.2)」でスタイルの特徴を補強するようなシナリオで使用され、トピックから外れたイメージを生成しないようにします;
- ネガティブキューガイド:ネガティブキューによって、不要な要素(「低画質、ぼやけた、醜い、余分な手足」など)を除外するためのセクション。例えば、人物の画像を生成する際に、「余分な指」を追加することで手足を避けることができます。例えば、キャラクター画像を生成する際、「余分な指、欠けた指」を追加することで、手足の変形を避け、生成される画像の品質を40%向上させることができます。
プロンプト・ブックでは、「純粋な文章指導」を放棄し、「同じ話題+異なるプロンプト」という比較事例を通して、言語の細部が生成効果に与える影響を示す:
- 一変量比較実験:同じトピック(例:「猫」)に対して、「スタイル・ワード」(例:「インク・スタイル」と「リアル・スタイル」)または「詳細説明」(例:「インク・スタイル」と「リアル・スタイル」)のみを変更する。リアルなスタイル”) や “詳細な説明” (例: “はっきりとした毛” vs “ぼやけた毛”) を変更することで、生成された画像の違いを示し、ユーザーが “キーワードの優先順位” を理解できるようにする。キーワードの優先順位」を理解するのに役立ちます;
- エラーヒントの修正:「逆ケース」(例:「ぼやけたヒント:”ナイスビュー”」)と「最適化のヒント」(例:「正確なヒント:”ナイスビュー”」)を含める。”(例:”正確なヒント:”アルプス山脈、日の出、油絵のスタイル、8K、詳細なテクスチャ、黄金の太陽光”)、ラベリング修正ロジック(例:”シーン+スタイル+解像度 “を追加)。Resolution “を追加);
- スタイライズされたエフェクトの分解:「サイバーパンク」、「スチームウェーブ」、「インクスタイル」などの一般的なスタイルについて、「コア要素+配色+光と影の特徴」に分解。光と影の特徴”、例えば “サイバーパンク “は “ネオンカラー(ピンク/ブルー)、ホログラフィック投影、建物の老朽化と技術の融合、雨の反射地面 “を含む必要があります。ユーザは、要素を押してプロンプトの単語を組み合わせるだけで、目標スタイルを安定して生成できる。
プロンプトブックのコンテンツは、「ビギナーからマスターへ」という学習パスに沿って設計されており、各モジュールは公式マニュアルや実際のテストケースと照合され、100%の精度で作成されています:
このモジュールは、ゼロベース・ユーザーのための “参入の鍵 “を提供し、”Stable Diffusionに必要性を “理解させる “ことに重点を置いています:
- コア構文ルール
- 例えば、”サイバーパンク・シティ、ネオンライト “は、”ネオンライト、サイバーパンク・シティ “よりも “都市の主題 “を強化する。”;
- 記号の使い方の指定:「コンマで区切られたキーワード」「()/[]ウェイトコントロール」「–arスケールパラメーター」の正しい使い方を詳しく説明する。”–ar 16:9 “はワイドスクリーン画像を生成する;
- 曖昧さを避ける:プロンプトは抽象的ではなく具体的である必要がある。例えば、”pretty girl “よりも “girl in red dress”、”HD “よりも “8K resolution “が望ましい。「高解像度」;
- 4要素のプロンプトテンプレート
例えば、”[被写体の説明、アクション/状態], [スタイルキーワード], [詳細説明(解像度、照明、テクスチャ)], [パラメータラベル(スケール、CFG値)]”:
例えば、”カフェの窓際に座って本を読んでいる女の子、リアルなスタイル、8K解像度、暖かい黄色の照明、細かい肌のテクスチャ、–ar 3:4、CFGスケール7″。
このモジュールは、プロンプトブックの「クリエイティブの宝庫」であり、20以上の人気スタイルのコア・キーワードを取り上げ、それぞれに「定義+コア要素+ヒント例」を収録しています:
- クラシックなアートスタイル
- 水墨画風:核となる要素「黒、白、灰色を基調とし、筆跡の質感、白い空間、中国風の建築や人物」、ヒント例:「水墨画風の山水画、遠くの山、漁船、明瞭な筆跡、白い空間の構成、-ar 2:1」;
- 油絵スタイル:核となる要素「重厚な色彩、筆跡の質感、光と影の強いコントラスト」、ヒント例:「ゴッホスタイルのヒマワリ畑、重厚な油絵具、黄金の陽光、明瞭な筆跡、8K、–ar 1:1」;
- モダン・ポップ・スタイル:
- サイバーパンク: コア要素「ネオンライト(ピンク/ブルー/パープル)、ホログラフィックプロジェクション、高層ビルボード、雨で反射する地面、未来的なハイテク感」、プロンプト例「サイバーパンクな東京の通り、ネオンサイン、ホログラフィックキャットプロジェクション、雨で濡れた舗道、8K、映画のような光と影、–ar16:9″;
- Steamwave:コア要素「ピンク/ブルーのグラデーション、ヴィンテージのコンピュータ要素、ローマの柱、ヤシの木、ノスタルジア」、プロンプト例:「Steamwaveスタイルのヴィンテージのベッドルーム、ピンクの壁、古いテレビセット、ヤシの木の装飾、グラデーションの光と影、–ar 4:3″;
- 特殊効果スタイル:
- ローポリゴン:コア要素「幾何学的なカラーブロック、グラデーションなし、きれいな輪郭」、ヒント例「ローポリゴンスタイルのキツネ、三角形のカラーブロックステッチ、オレンジ/白のドミナント、きれいな背景、–ar 1:1」;
- 線細工スタイル:コア要素「黒い線、白い背景、詳細な輪郭、塗りつぶし色なし」、ヒント例「猫の線細工、詳細な毛皮の輪郭、白い背景、きれいな線、–ar 3:4」。
このモジュールでは、「同じトピック+異なる手がかり」の比較を通じて、手がかりの詳細の重要性を「自分の目で確かめる」ことができます:
- ケース1:被写体描写の正確さの比較
- あいまいなプロンプト:「少女」 → 生成結果:顔がぼやけ、服装が不明確;
- 正確なプロンプト:「20歳の女の子、茶色の巻き毛、白いワンピース、桜の木の下に立っていて、微笑んでいて、手はそっと握りしめられている」→生成結果:キャラクターの特徴は明確、シーンの詳細は完全;
- 結論:「年齢、髪型、服装、行動、シーン」を補足することで、生成精度を大幅に向上させることができる。
- ケース2:スタイルワードの重みの比較
- 通常のプロンプト:「サイバーパンク・シティ、インク・スタイル」 → 生成結果:スタイルが混在し、サイバーパンクの特徴は目立たない;
- ウェイト最適化のヒント:「(サイバーパンク・シティ:1.2)、インクとウォッシュのスタイル」 → 生成結果:サイバーパンクをベースに、インクとウォッシュのストロークをブレンドして、より統一感のあるスタイルに;
- 結論:ウェイト表記によってスタイルの優先順位を明確にすることで、「スタイル争い」を避けることができる。
- ケース3:ネガティブ・キュー・ワードの効果比較
- ネガティブキューなし:「ポートレート」→生成結果:「顔がぼやけている、指が冗長」という問題がある;
- ネガティブキューを追加:「ポートレート、高画質、8K、–低画質、ぼやけ、余分な指はない」→生成結果:鮮明な顔、正常な手足;
- 結論:ネガティブキューは「エラーをなくす」鍵であり、生成品質を30%以上向上させることができる。
このモジュールでは、Stable Diffusionのコアパラメーターについて、やみくもなパラメーター調整を避けるための「初心者にやさしい」設定ガイドを提供します:
- 主要なパラメータは詳細に説明されています:
- 解像度:基礎知識のないユーザーは512×512から始めることを推奨し、デバイスの性能が許せば768×768にアップグレードすることができる;
- CFGスケール(キュー適合度):範囲は1~30、推奨は7~10 – 7より低いと偏差キューが生成され、10より高いと画像が硬くなる;
- サンプリング・ステップ:20~30ステップを推奨、20ステップはスピードとクオリティのバランスが取れる、30ステップは詳細なシーンの追求に適している;
- シード:-1はランダムに生成され、シード値を固定すると同じ画像を再現でき、シード値を変更すると同じスタイルのバリエーションを生成できる;
- シナリオベースのパラメーターテンプレート:
- 高速生成(効率重視):解像度512×512、CFGスケール7、サンプリングステップ20、シード値-1;
- 詳細生成(品質重視):解像度768×768、CFGスケール9、サンプリングステップ30、シード値固定;
- スタイライズ生成(創造性重視):解像度512×768、CFGスケール8、サンプリングステップ25、スタイライズワードの重み調整を追加。
このモジュールでは、複雑なシナリオに対応したキューワードロジックをカバーする「高度なキー」を経験豊富なクリエイターに提供します:
- 複数被写体コラボレーションのヒント:複数の要素を含む画像を生成する場合、「被写体関係」を明確にする必要があります。例えば、「ソファに座る少女、その隣に猫、毛糸玉で遊ぶ猫、リビングの風景、リアルなスタイル」のように、要素の混同を避けることができます;
- ダイナミック・エフェクトのヒント:「アクションの説明+ダイナミックなぼかしの言葉」で躍動感を出す、例えば「走るティーンエイジャー、トレンチコートがなびく、ダイナミックなぼかし、8K、サイバーパンクな街の背景」;
- 著作権遵守のヒント:コミュニティが補足する「著作権回避のヒント」を追加する。を追加する;
- クロスプラットフォーム対応:取扱説明書の内容は、Stable Diffusion 1.5/2.1、Automatic1111 WebUI、ComfyUIなどの主流ツールに対応しており、プロンプトやパラメータは、フォーマットを調整することなくそのまま再利用できます。
プロンプトブックの学習と練習のプロセスは明確で、公式推奨パスは実際の作成と親和性が高い:
- リソースの入手:OpenArt公式サイトからPDF版のプロンプトブックをダウンロードし、「モジュール1:基本構文」を中心に読む;
- コアフレームワークの習得:「ボディ+スタイル+詳細+パラメータ」の構造を覚え、「()/[]」のウエイト記号の使い方を理解する;
- 初期練習:Stable Diffusion WebUIで簡単なプロンプトワード(例えば”(cat:1.1), cyberpunk style, 8K”)を入力し、生成効果を観察し、ウェイトシンボルの影響を感じる。
- スタイルの選択:「モジュール2:スタイル修正シソーラス」から対象となるスタイル(例:「水墨画風」)を探し、核となる要素を抽出する;
- プロンプトワードを組み合わせる:「4つの要素フレームワーク」に従ってプロンプトワードを組み合わせる。例:「山の峰、曇り、松の木、筆跡のテクスチャ、白い背景、–ar 2:1、CFGスケール8」のようなインクとウォッシュのスタイル;
- 生成テスト:キューワードを入力し、マニュアルで提案されているようにパラメータを設定し、最初の様式化された画像を生成し、効果の偏差を記録する(「雲が十分に見えない」など)。
- 類似のケースを探す:「モジュール3:ケースの比較分析」で、同じスタイルのケースを探し、自分のキュー・ワードの違いを比較する;
- ズレを修正する:生成された「インク・ピークス」の雲が目立たない場合、ケースを参照して「(雲:1.2)、軽いテクスチャ」を追加する;
- 否定的なヒントを追加する:「ぼやけた、余分な要素」の問題に対して、「–低品質、ぼやけた、余分なオブジェクト」を追加し、再生成して効果を比較する。
- パラメータの最適化:画像の詳細が不十分な場合は、マニュアルにあるように「サンプリングステップを20から30に」「解像度を512×512から768×768に」上げる;
- シード値の固定:満足のいく生成結果が得られたら、シード値を記録し、キューワード(「飛ぶ鳥の要素を追加する」など)を微調整して、同じスタイルのバリエーションを生成します;
- バッチ生成:WebUI の「バッチ生成」機能を使用して、最適化されたプロンプトを 3~5 セット入力し、最良の結果をフィルタリングする。
- 複雑なシーンの実験:「モジュール5:高度なテクニック」を学び、複数の被写体の画像を生成する(例:「家族の夕食シーン、5人が食卓を囲んで座っている、写実的なスタイル」);
- 新しいスタイルの探求:コミュニティによって追加された新しいスタイルワード(例:「AIがアートスタイルを生成」)を組み合わせて、創作の種類を増やす;
- 経験をまとめる:「効果的なキューワード+パラメーターの組み合わせ」を記録することで、個人のスタイルテンプレートを形成し、その後の制作効率を高める。