AIの画像生成って、正直ここ1〜2年でめちゃくちゃ変わった。

以前はGeminiが割と使いやすくて気に入っていたんだが、最近ChatGPTがそれをはるかに超えてきた。

2025年3月、OpenAIはChatGPTの基盤モデル「GPT-4o」に、ネイティブな画像生成機能を統合した。 単なる新機能の追加じゃなく、テキスト生成と画像生成が同じモデルの中で一体化した、という意味でかなりでかいアップデートだ。

何がそんなに変わったのか

プロンプトをちゃんと理解してくれる

これが一番でかい。

今まで「左にこれを置いて、右にこれを配置して」みたいな細かい指示を入れると、全然意図と違うものが生成されてストレスだった。GPT-4oでは、一度に10〜20個の要素を正確に画像内に配置できるようになっており 、ちゃんとプロンプトを丁寧に書けばそれなりのものが出てくる。

② 日本語テキストが崩れない

これ地味に革命的だと思う。

従来のAIでは日本語が英語に置き換わったり、文字が化けたりする問題があったが、GPT-4oではそうした課題が大幅に解消されている。看板やインフォグラフィック、バナーなど「文字が主役」の画像を作るときに、今まではどうしても文字がぐちゃぐちゃになって使い物にならなかった。それが普通にきれいに出るようになった。

③ 会話しながら修正できる

生成した画像に対して「背景をもう少し明るくして」「この部分だけ色変えて」とチャットで指示すれば、その場で微調整してくれる。Chat形式での操作で、プロレベルのビジュアルを手軽に制作できるようになった。これが従来の画像生成AIとの一番大きな差だと感じている。

実際に試してみた

上がさっき試しに作った画像だ。

プロンプトはシンプルに入れただけなのに、クオリティがかなり高い。人間が作ったデザインっぽい自然さがある。Geminiで生成したときに出ていた「角っこの透かしマーク」みたいなものも当然ない。

GeminiやMidjourneyと比べてどうなのか

Geminiは以前まで使いやすくて好きだったが、今は画像のクオリティという意味では明らかにChatGPTに抜かれた。Midjourneyは芸術的な表現は強いが、使うのに別環境(Discord)が必要で手軽さでは劣る。

ChatGPTはブラウザでもアプリでも、普通にチャットしながらそのまま画像が作れる。この「手軽さ×クオリティ」のバランスが今一番ちょうどいいと思う。

無料でも使えるのか

無料プランの場合は1日3回までの制限があるが、高品質な画像生成を体験することはできる。有料プラン(Plus・Teamなど)であれば、より多くの画像を生成可能だ。

まずは無料で試してみて、ちょっと物足りなければ有料を検討するのがいいと思う。

まとめ

正直、ここまで進化が早いとは思っていなかった。

半年前と比べても全然違うし、使ってみると「これ本当にAIが作ったの?」ってなる場面がちょいちょいある。画像生成AIを試したことない人も、一度ChatGPTで触ってみてほしい。プロンプトを丁寧に書くだけで、想像より全然いいものが出てくる。