【初心者向け】思い通りに画像を生成する！画像生成プロンプト作成ガイド

はじめに

以前は画像生成AI技術はなかなか思い通りの画像が生成されなかったり、日本語テキストの生成の精度が低いなどの課題がありましたが、昨今ではOpenAIやGoogleなどが提供している画像生成モデルの精度が大幅に向上し、ビジネスにおいても活用の幅が広がっています。
この記事ではChatGPTやMicrosoft Copilotで画像生成AIを使って思い通りの画像を生成するためのプロンプトの書き方について説明します。
※初心者向けのため、応用的な内容ではなく、基本的な内容になります。

ビジネスにおける画像生成のユースケース

ビジネスにおいての画像生成系AIの活用事例として以下のようなものがあります。

1. デザイン・コンテンツ制作

製品ロゴやアイコン、サムネイル画像、キャラクター、書籍表紙、UI素材などの生成。新しく生成するコンテンツに対して、AIにアイディアを提案させたい場合に使用します。

例 (新製品の画像をAIに提案させる)

最先端感のある最新スペックPCのデザインを提案せよ。

hogehoge_ai

例 (新製品のアイコンをAIに提案させる)

新しいAIチャットサービス「Hogehoge AI」のアイコンを生成せよ

hogehoge_ai

2. マーケティング・プロモーション

商品画像、広告用画像、イベント告知画像などの生成。
販売促進や集客目的で視覚的訴求を強化したい場合に使用します。

例 (イベント告知用画像を生成系AIに作成させる)

10月開催のテックカンファレンス告知用のSNS投稿用の画像

tech_conference

3. 業務・資料作成支援

図解、構成図、スライド背景、資料添付用画像などの生成。文章だと分かりづらい事柄を図で表現させたり、資料作成の素材を生成させたい場合に使用します。

例 (図解: 生成系AIとチャットしていて分からなかったことなどを図で表現させる)

今までの会話内容をもとにLLMの概念について説明する画像を作成して

llm

例: PowerPointのスライド背景

テクノロジー×イノベーションを象徴するデザインのスライド背景を生成して

slide

既存画像への編集

最新の生成系AIでは既存の画像に対しての編集も可能になっており、以下のようなことができます。

テロップ挿入
- キャッチコピーの挿入
- タイトルの挿入
- 日付情報の挿入

この画像にキャッチコピーを追加した画像を生成して

interior catch_copy

画像の一部を別の画像と差し替え
- 商品や人物画像の背景を変更し、商品、人物にあった背景を検証
- 商品や人物画像を変更し、背景にあった商品、人物を検証

画像内の花瓶をコーヒーカップに変更した画像を生成して

interior coffee

画像の一部を削除
- 商品写真の余計な影や撮影機材を削除
- 観光地やイベント写真の通行人を消去

画像内の机を削除して

interior none

特に最新の画像生成AIモデルは日本語の生成精度が上がったことにより、テキスト画像の生成が期待した通りの結果が得やすくなっており、テロップ挿入などがビジネスツールとしてかなり強力になってきています。

次の節からは実際に画像生成させるプロンプトを記載する際のテクニックについて紹介します。

画像生成プロンプトの基本原則

画像生成AIで理想のイメージをつくるためには、AIに「どんな画像を描いてほしいのか」を正確に伝えることが大切です。どんな画像を生成する場合にも必要な基本的な考え方を説明します。

生成系AIに画像生成をさせるプロンプトを記載する際のポイントは以下の点です。

キーワードだけでなく、文章で記載する
画像生成に必要な要素を記載する
一度で完璧を目指さない、反復的改善を意識
画像生成プロンプト自体をAIに生成させる

1. キーワードだけでなく、文章で記載

短いキーワードを並べるだけでは、AIが意図を正確に理解できないことがあります。
最新の高度な画像生成AIは「文脈」を読み取って画像を生成してくれるため、自然な文章で状況や雰囲気を伝えることでユーザーの期待した画像を生成してくれるようになります。

たとえば「森、公園、夕方」とだけ書くと、AIは「どんな光？どんな構図？何を主題にすればいいのか？」が分かりません。
一方、「夕暮れの森林公園で光に照らされた美しい風景」と文章で書けば、AIは「時間帯」「雰囲気」「被写体の位置」まで理解しやすくなります。
つまり、単語の列ではなく、シーンの説明をするつもりで書くのがコツです。

簡潔かつ詳細に長すぎても短すぎても伝わりません。
主題・状況・雰囲気を1〜3文で具体的にまとめるのが理想です。
自然文形式で記述「タグの羅列」ではなく「普通の文章」として書くことで、AIがより正確にイメージを再現します。

例

夕暮れの森林公園で、木々の隙間から柔らかな光が差し込む幻想的な風景。  
静かな池のほとりに立つ一人の女性が、夕日に照らされて穏やかな表情を浮かべている。

2. 画像生成に必要な要素を記載する

画像生成に必要な主な要素は、スタイル、主題、背景、色、光、構図の6要素です。
ざっくりで書いてもAIがある程度汲み取ってくれますが、これらを指定することで、AIが「何を」「どんな雰囲気で」描けばよいかを理解しやすくなり、期待した画像が生成される確率がぐっと上がります。
必ず全てをプロンプトで指定する必要はありませんが、スタイルと主題の2つは最低限記載しておきたい項目です。

1. スタイル

「フォトリアル (実写)」、「イラスト」など 「画像をどんな見た目にしたいか」 を記載します。

また、生成した画像のイメージが固まっているのであれば、画像の質感などより詳細な情報をスタイルに追加すると、期待した画像が生成されやすくなります。

技法: 「油絵」「水彩画」「木炭スケッチ」「ピクセルアート」、「3Dレンダー」、「テキストロゴ」など。
質感: 「ガラス製」「紙の彫刻」「木彫り」「金属の質感」など重視する項目を記載。
トーン:「ノスタルジック」「穏やか」「ドラマチック」「夢のような」など。

実写の場合は「白黒写真」「フィルム風」など写真の質感を指定すると効果的です。

写真の質感: 「ポラロイド」「フィルムグレイン (粒状感)」「白黒」「ビネット (周辺減光)」。

例

夜の未来都市を`3Dレンダーのイラスト`で表現

2. 主題

画像のテーマや、被写体となる物体など「何を描いてほしいか」を記載します。
テーマとして商品PR画像や製品のロゴ、アイコン画像など画像を生成する目的を記載することで、AIがテーマに合わせた画像を考案してくれるようになります。
また、被写体についても具体的に記載しないとAIのさじ加減で生成されてしまうので、人物であれば、性別、年齢、人種、人数、服装、表情、動作などできるだけ具体的に記載するようにしましょう。

例

ランニングシャツを着て、笑って走っている50代のヒゲを生やして男性2人

3. 背景

被写体が「どんな場所にいるのか」「どんな環境なのか」を伝えます。
背景を指定することで、全体の雰囲気や世界観がぐっと明確になります。

例

暖炉とソファのある`落ち着いた雰囲気のリビングルーム`

4. 色

画像の「印象」を決める重要な要素が色です。
色を意識的に指定することで、見る人の感情や作品の雰囲気をコントロールできます。

色調・ムード (Color Palette/Mood)

たとえば「暖色系」なら温かく優しい印象、「クールな寒色系」なら静かで落ち着いた印象になります。
「くすんだ中間色」「映画のようなシネマティックトーン」なども有効です。

例

夕焼けに染まる街並みを、暖色系の柔らかなトーンで描写。

5. 光

光の明るさや方向を少し変えるだけで、同じ被写体でも印象が大きく変わります。
例として照明の種類や、時間帯などを指定することで、光の明るさの度合いを指定することができます。

照明「柔らかな自然光」「ゴールデンアワー（夕暮れ時）」「逆光」「ネオン照明」など、光の質を明確に伝えます。
時間帯「日の出」「夕焼け」「夜の街灯」「雨の朝」など、時間を指定することで雰囲気が具体的になります。

例

朝の柔らかな自然光が差し込む部屋の中で、木製の机の上に置かれたコーヒーカップを撮影。  
窓からの光がカップをやさしく照らし、静かな朝の空気を感じさせる。

6. 構図

構図は「どこから・どの距離で・どう見せるか」を決める重要なポイントです。
以下のように被写体の位置やカメラの角度を指定すると、生成される画像にも影響がでます。

距離感 (Distance) 「クローズアップ（接写）」「ミディアムショット（中距離）」「ワイドショット（広角）」などで見せ方を調整します。
視点・角度「見上げる」「見下ろす」「空撮」「主観視点」など、視点を決めると臨場感が生まれます。
レンズ指定「50mmポートレート」「マクロレンズ」「魚眼レンズ」などを指定することで、遠近感をコントロールできます。
撮影効果「ボケ」「モーションブラー」「長時間露光」などの写真効果も有効です。
アスペクト比
「16:9（横長）」「1:1（正方形）」など、用途に合わせた比率を指定します。

例

夕暮れの海辺で波打ち際を歩く人物を、ワイドショットで撮影。  
逆光の太陽がシルエットを美しく際立たせ、映画のワンシーンのような構図にする。

3. 一度で完璧を目指さない、反復的改善を意識

毎回1回で期待した通りの画像を出すのはやはり難しいです。
1回で理想の結果を出すことを求めず、生成結果を見ながらプロンプトを少しずつ洗練していきましょう。

4. 画像生成プロンプト自体をAIに生成させよう

元となる情報をAIに渡して、ブラッシュアップした画像生成プロンプトをAIに生成させるのもありです。
AIをフル活用して精度の高いプロンプトを生成していきましょう。

画像生成プロンプトの例

「実写画像を作りたい」

リアルな画像の場合を作りたい場合は、カメラアングル、レンズの種類、照明、細部などを指定すると、写真のようにリアルな画像が出力されやすくなります。

以下の要件に従って画像を生成せよ。
- スタイル:
  - 種類: フォトリアル
  - 質感: ポラロイド
- 主題:
  - テーマ: 自然な美しさを引き出すコスメブランドの広告ビジュアル。清潔感と透明感を重視し、`自分らしい美しさ`を表現するメイクシーンを描く。
  - 被写体: メイク中の20代のアメリカ人女性
- 背景:
  - 場所: 化粧室
- 色:
  - 色調: 暖色系（ベージュ・ピンクトーン）
  - 雰囲気: 清潔感と温かみを両立
- 光: 
  - 種類: 柔らかな自然光（窓際からの光）
  - 強度: 中程度
  - 方向: 斜め前方から照射
- 構図:
  - 距離感: クローズアップ
  - アングル: 正面やや上から
  - レンズ: 50mm標準レンズ
  - アスペクト比: 4:5（Instagram広告向け）

「イラストを作りたい!!」

ステッカー、アイコンなどのイラストを作りたい場合は、画像のスタイル、色使い、線のスタイルなどを指定しましょう。

以下の要件に従って画像を生成せよ。
- スタイル:
  - 種類: カートゥーンイラスト
  - タッチ: 丸みを帯びた形と柔らかい陰影
- 主題:
  - テーマ: 「幼児向け知育アプリに登場する動物キャラクター。明るく前向きで、子どもたちが安心して親しめるようにデザインする。」
  - 被写体: 笑顔のライオンの子ども（小さな王冠とリュックを背負っている）
- 背景:
  - 背景色: 透明
- 色:
  - 色調: オレンジ・イエロー・スカイブルーを中心に高彩度
  - 雰囲気: はっきりとした配色で視認性重視
- 構図:
  - 距離感: ワイドショット
  - アングル: 正面

illust

「テキスト画像を生成したい!!」

製品ロゴなどテキスト画像を生成したい場合はテキスト、フォントスタイル（説明）、全体的なデザインを指定します。
また、言語を指定しないと望んだ言語で出力されないことがあるので、何語でテキストを作りたいのか明示的に指定しましょう

以下の要件に従って画像を生成せよ。
- スタイル:
  - 種類: テキストロゴ
  - 雰囲気: シンプルで高級感のある印象
- 主題:
  - テーマ: 「新コスメブランド『LUMINA（ルミナ）』のブランドロゴ。光と透明感をモチーフに、自然な美しさと洗練さを表現する。」
  - テキスト: LUMINA
  - フォント: 細めのサンセリフ体、曲線的で女性的なデザイン
  - 言語: 英語
- 背景:
  - 背景色: ソフトなグラデーション（ホワイト〜パールピンク）
- 色:
  - 色調: メインカラーはゴールドとホワイト、アクセントカラーはごく薄いピンク
  - 雰囲気: 明るく柔らかい
- 光:
  - 種類: 柔らかな自然光
  - 効果: ロゴの上部にほのかなハイライトを加えて輝きを演出
- 構図:
  - 配置: テキストを中央に配置
  - アスペクト比: 16:9

text

参考

おわりに

この記事では生成系AIで画像生成させるプロンプトを記載する際のポイントについて記載しました。
この記事が、画像生成AIを使い始める方の参考になれば幸いです。
プロンプトの工夫次第で、AIが生み出す画像のクオリティやバリエーションは大きく変わります。
まずは基本を押さえ、少しずつ自分なりの表現を試してみてください。
今後も画像生成AIの進化に注目しながら、より理想に近い画像を作れるようチャレンジしていきましょう。