GPT Image

初版 2025年3月25日 (12か月前)

1.5 / 2025年12月16日 (4か月前)

GPT Image
GPT Image 1.5によって生成された水彩画風の画像
開発元	OpenAI
初版	2025年3月25日 (12か月前) (2025-03-25)

最新版	1.5 / 2025年12月16日 (4か月前) (2025-12-16)
前身	DALL-E
種別	画像生成および画像編集
公式サイト	ChatGPT Images
テンプレートを表示

GPT Imageは、OpenAIによって開発された画像生成および編集モデルのシリーズである。GPTファミリーのテキストから画像を生成するモデルの一種であり、ディープラーニングの手法を用いて、自然言語による記述や既存の画像からデジタル画像を精密に生成する。 DALL-Eの後継として、GPT ImageはChatGPTにネイティブに組み込まれており、APIを通じても利用可能である。2025年3月のリリース時、GPT Imageはソーシャルメディア上で、特にスタジオジブリ風の画像を生成する機能によりバイラル的な人気を集めた。また、GPT ImageはMicrosoft CopilotやApple Intelligenceでも利用可能である。

GPT Imageの最初のモデルは、2025年3月25日のブログ投稿で「GPT-4o画像生成」としてOpenAIによって公開され、画像を生成するためにGPT-4oモデルに基づいて開発された^[1]。当初は有料ユーザーのみに提供され、需要の高さから無料ユーザーへの展開は遅れた^[2]。その後、サム・アルトマンが使用レベルの高さからGPUが「溶けている」と発言し、機能の使用は制限された^[3]。OpenAIは後に、最初の1週間で世界中の1億3000万人以上のユーザーが7億枚以上の画像を作成したと述べている^[4]。このモデルはGPT Image 1（gpt-image-1）と名付けられ、4月23日にAPIに導入された。費用対効果の高いバージョンであるGPT Image 1 Mini（gpt-image-1-mini）は、OpenAI DevDay 2025と同じ10月6日にリリースされ、APIでのコストはGPT Image 1よりも80%安価であった^[5]^[6]。

GPT Image 1.5（gpt-image-1.5）という名前の新しいモデルは12月16日に導入され、「ChatGPT Images」として世界中のすべてのユーザーに展開されるとともに、API経由でも即座に利用可能になった^[7]。OpenAIは、新しいモデルが詳細を維持しながら正確な編集を行うことができ、最大4倍の速度で画像を生成すると主張している。APIでの画像の入力と出力は、GPT Image 1と比較してGPT Image 1.5の方が20%安価である^[8]。

機能

DALL-E 2およびDALL-E 3モデルなどの以前の拡散モデルとは異なり、GPT Imageモデルは自己回帰的であり、画像から画像への変換、高度なフォトリアリズム、詳細な指示の遵守など、いくつかの新機能を備えている^[9]。GPT Imageは、1024×1024（1:1、正方形）、1536×1024（3:2、横長）、1024×1536（2:3、縦長）ピクセルの3つのサイズで画像を生成できる^[10]。

GPT Image 1.5は、以前のモデルで見られた不自然なトリミングや暖色系への偏りを改善しているが^[1]、特定のいくつかのアートスタイルの生成においては後退している。さらに、複数の顔や、中国語、アラビア語、ヘブライ語などの一部の言語に関する弱点は、最新モデルでも依然として残っている^[7]。

評価

テクノロジー評論家は概ね、GPT Imageを画像生成における重要な進歩と見なしている。TechRadarは、GPT Image 1が写実的な風景から様式化されたイラストまで幅広い出力を生成できる目覚ましいパフォーマンスを提供していると強調し、以前のツールと比較してテキストのレンダリングとマルチモーダル統合において顕著な改善が見られると指摘した。しかし、Heise Onlineは、GPT Image 1が過剰なシャープニングによるアーティファクト、暖色系への偏り、人間の姿勢や物体の重なりをレンダリングする際の一般的な間違いなどの技術的弱点を示しており、全体的なパフォーマンスは強力であるものの、出力のリアリズムには限界があることを示唆していると報じた^[11]。

文化的影響

2025年3月のGPT Image 1の公開時、スタジオジブリ映画のスタイルで再現された写真がバイラル的に拡散された^[12]。サム・アルトマンは、自身のTwitterのプロフィール画像をスタジオジブリにインスパイアされたものに変更することで、このトレンドを認識した^[13]^[14]。ホワイトハウスの公式Twitterアカウントは、フェンタニル密売の有罪判決を受けて以前に追放された移民であるバージニア・バソラ＝ゴンザレスが移民局によって逮捕されたことを嘲笑するジブリ風の画像を投稿し、移民局の職員が手錠をかけている際に彼女が泣いている様子を描いた^[15]^[16]^[17]。北米の配給会社であるGKIDSはプレスリリースでこのトレンドに反応し、フィルターの使用を、同時期に行われた1997年のスタジオジブリ映画『もののけ姫』のIMAX再上映と比較した^[18]。

機能

評価

文化的影響

関連項目

外部リンク

脚注

Related Articles