AI Midjourney Prompt Engineerとは?
- プロンプトエンジニア:CGI作成(2D/3D)、プログラムツール
- AIミッドジャーニーとは?- 簡単に説明
- プロ分野におけるCGIのためのAIツール?
- プロンプト・エンジニアとは?
- プロンプト エンジニア - アーティストかコンピューターオタクか?
- AIツールは創造的か?
- 最も有用なAIミッドジャーニーのプロンプト
- よくあるご質問
プロンプトエンジニア:CGI作成(2D/3D)、プログラムツール
芸術はもちろん技術から生まれる。そしてプログラマーはプログラミングをする。コーディングと創造性を組み合わせれば、プロンプト・エンジニアになる。しかし、これは本当にまだ創造的な職業なのだろうか?
これはアートなのか、それとも行けるのか」という言葉は、いったいどこから来るのか、今日ではもはや理解できない。この疑問は、一般的に現代アートに関して提起される。しかし、画像素材がコンピューター上で作成された場合、それはどのように見えるのだろうか?プロンプト・エンジニアに存在する権利はあるのだろうか?
AIミッドジャーニーとは?- 簡単に説明
AI Midjourneyは、人工知能を使ってコンピューター生成画像(略してCGI)を作成できる数多くのプログラムのひとつだ。簡単に言うと、どんな画像が欲しいかチャットウィンドウに短い指示を入力する。するとAIが画像を生成する。AI Midjourneyの操作はDiscordというチャットツールで行う。AIは短時間のうちに4つの提案を吐き出し、あなたは画像を選択し、作業を続ける。原則として、結果は最初にあなたが考えたものに近いが、あなたが本当に望んでいるものではない。ここまでは平凡だ。それは認める:簡単な指示からツールが何を作るかを見るのはとても楽しい。
しかし、あなたは人間であり、人とのコミュニケーションに慣れている。人間はあなたが話す言葉だけでなく、声の高さやトーン、話すスピードやメロディー、間、表情、ジェスチャーなども考慮して言語を理解する。AIにはこれができないため、あなたの指示の大部分が失われてしまうのだ。これは最初のうちは問題ではなく、いつでもより詳しく説明し、改善することができる。
プロ分野におけるCGIのためのAIツール?
もしあなたが特別な表現を求めているなら、3DビジュアライゼーションやCG画像の中にあなた自身のデザインの言葉を見つけたいなら、ツールとのコミュニケーションはすぐに限界に達するだろう。誤解しないでください:もちろん、私たちダントツリースタジオは、紙とペンだけで仕事をしているわけではありません。CGIはコンピュータで作るものであることは明らかです。適切な3Dソフトがなければできません。そして今日、これには少なくとも初歩的なAIが搭載されていることが多い。
ツールは問題ではない。AIがサポートする画像生成は可能なだけでなく、今ではかなり優秀だ。しかし、どうすればツールに思い通りのものを作らせることができるのだろうか?プログラムでは真の創造性を発揮することはできない。新しいものを創造すること、特定のメッセージを持った視覚的な表現をすること、それができるのは人間だけだ。AI Midjourneyのようなプログラムは、写真家にとってのカメラのようなものだ。
プロンプト・エンジニアとは?
プロンプト・エンジニアという職業は以前からあった。プロンプトエンジニアは、プロンプト、つまりAIとの共同作業を可能にする音声コマンドを作成します。すでにMidjourneyやChatGPT、あるいは同様のツールに慣れ親しんでいる人ならわかるだろう:簡単ではない。ツールはあなたの言葉を全く話さないのだ。プログラムから有用な結果を得るには、プログラミングの基礎知識があると有利です。なぜなら、厳密に言えば、プロンプトはプログラミングだからです。
しかし、プロンプト・エンジニアが具体的に何ができるようになる必要があるかは、どのツールを使うか、そしてその結果がどうあるべきかによる。もちろん、プロンプトエンジニアは、いわゆるLLM(大規模言語モデル)の扱いに精通していなければならない。何しろ、プロンプトはまさにこのために作られるのだから。エンジニアはマーケティング担当者、デザイナー、コピーライターなどとチームを組んで仕事をする。
プロンプト・エンジニアの仕事を個々のステップやステーションに分けると、次のようになる。
- ステートメントをどのように視覚的に伝えることができるかというクリエイティブなアイデアを持つ
- アイデアを人間の言葉に翻訳し、クリエイティブな専門家とチームで議論する
- 結果をAIが理解できるプロンプトに翻訳する
- プログラムが作成したものをチームで議論し、さらなるプロンプトを介して、ある時点で適合するように改善する。
複雑に聞こえる?もちろんだ!
AI Midjourneyのプロンプト入力:
AIミッドジャーニー・プロンプト
プロンプト エンジニア - アーティストかコンピューターオタクか?
3Dエージェンシーとして、私たちは自らの経験から、プロンプト作成のスペシャリストはその両方であると言えます。もちろん、高品質の3Dビジュアライゼーションや 3Dアニメーションを制作するには、膨大なクリエイティビティが必要です。創造性がなければ、たとえAIが最終的にテキスト指示を3D画像に変換したとしても、何も機能しません。しかし、プログラムに関する特別な知識と、ありきたりなコンピューター・オタクにありがちなプログラミングへの親和性がなければ、それは不可能です。
AIツールは創造的か?
オープンAIのChatGPTやMidjourneyのようなツールは、実際にクリエイティブであるかのような錯覚を起こさせる。しかし、これは部分的なものに過ぎない。実際には、これらのプログラムは巨大なデータベースにアクセスし、そこに保存されている情報を組み替えているだけなのだ。極端に単純化すれば、このツールは既存の目、鼻、口、2つの耳から顔を作ることができる。あらかじめ定義された基準に従って、目を別の色の目に置き換えたり、頭髪を追加したり、唇の色を変えたりすることができる。AIは完全に新しい顔を作ることはできない。このツールはまた、合成された画像が最終的に人間にとって信頼できるものに見えるかどうか、意図したメッセージを伝えているかどうかを判断することもできない。人工知能は愚かで、創造的ではない。
ChatGPTはコードを書くことができる。そしてAIはもちろん、他のAIツールのプロンプトを作成することができる。結局のところ、プロンプトとは小さなプログラムのようなものにすぎない。しかし、ここでもAIは愚かで創造的ではない。プロンプトは、データベースにある既存のコマンドからまとめられる。このようなAIが生成したプロンプトは、おおよそ適切な結果を得るには十分かもしれないが、微調整作業には、それぞれの結果をチェックし、適合させる人間が必要だ。
今後数年、そしておそらく数十年、このようなツールを使ってCGIを作成できるクリエイティブな人材が常に必要とされるでしょう。3Dであれ2Dであれ、プロンプトエンジニアは必要とされている!プロンプトエンジニアは現在、需要があるだけでなく、非常に高給でもある。
最も有用なAIミッドジャーニーのプロンプト
確かに:AI Midjourneyや似たようなツールで長く遊んでいれば、どのプロンプトが特に便利か自分で気づくだろう。ここではその手間を省き、最も役に立つコマンドを紹介したい:
- /image: プロンプトをもとに画像を生成
- /private: プロンプトをプライベートに設定し、他のユーザーが見たりリミックスしたりできないようにする(有料)
- /show: 古いプロンプトを呼び出す
- -no: 画像から削除する要素のパラメータ
- -stylise: 低い値ではプロンプトをより厳密に評価し、高い値ではプロンプトを自由に解釈する
- /describe:画像をアップロードし、プロンプトを使用すると、ツールは適切なプロンプト案を、時には非常に複雑なパラメータを使って作成する
-aspect (あるいは -ar): 画像のアスペクト比を定義する
- -chaos XX: 抽象度の正確な値(XXには0から100までの数値を使用)
- ::X:画像の構成要素の重みを定義します(X が重みを決定します)
- -video: タイムラプスビデオとして進行状況を保存
-q および -hd: 解像度を定義します。「フォトリアリスティック」、「超詳細」、「8K」などの用語も使用します
- /image prompt: (画像の URL)(テキストの説明):画像は、リンクされた画像のモデルに従って、テキストに基づいて作成されます。
これはまさに、特定のスタイルやデザインの種類を指定するものです。「ジャパニーズ・アニメ・スタイル "は1つのオプションであり、"スチーム・パンク・スタイル "は別のオプションです。ムードや照明効果については、例えば「クリスマス照明」や「シネマティック照明」のように正確に記述します。