AutoGPT

開発元トーラン・ブルース・リチャーズ

初版 2023年3月30日

リポジトリ github.com/Significant-Gravitas/AutoGPT

プログラミング
言語 Python、TypeScript

AutoGPT

開発元	トーラン・ブルース・リチャーズ
初版	2023年3月30日
リポジトリ	github.com/Significant-Gravitas/AutoGPT
プログラミング言語	Python、TypeScript
種別	自律型人工知能ソフトウェアエージェント
ライセンス	MITライセンス
公式サイト	https://agpt.co
テンプレートを表示

AutoGPTは、ユーザーが自然言語で指定した目標の達成を試みる、オープンソースの自律型ソフトウェアエージェントであり、GPT-4などのOpenAIの大規模言語モデルを使用している^[1]。ユーザーの継続的な指示を必要とするチャットボットとは異なり、AutoGPTは主要な目標をより小さなサブタスクに分割し、ウェブブラウジングやファイル管理などのツールを使用してそれらを完了することで自律的に機能する^[2]^[3]。

2023年3月にリリースされたこのプロジェクトは、GitHubやソーシャルメディアで急速に人気を集め、ユーザーはソフトウェア開発、市場調査、コンテンツ作成などのタスク用のエージェントを作成した^[3]。注目すべき実験の1つとして、ChaosGPTに人類を滅ぼす任務が与えられ、この技術の潜在的な可能性に世間の注目が集まった^[4]。しかし、AutoGPTには、ループに陥りやすいこと、情報をハルシネーション（幻覚）すること、有料APIに依存しているため運用コストが高くなることなどの重大な制限があることでも知られている^[5]^[2]^[6]。

AutoGPTは、ビデオゲーム会社Significant Gravitas Ltd.の創設者であるトーラン・ブルース・リチャーズによって、2023年3月30日にリリースされた^[3]。これは、数週間前にリリースされたGPT-4の自律的な機能を実証した、広くアクセス可能な最初のアプリケーションの1つであった^[3]。リチャーズの目標は、絶え間ない人間の介入を必要とせずに、リアルタイムのフィードバックに応答し、長期的な視野で目的を追求できるモデルを作成することであった^[7]。

このアプリケーションは、エージェントの名前、役割、および主要な目標（それを達成するための最大5つのサブ目標を含む）を定義するようにユーザーに促すことで動作する^[8]。その後、AutoGPTは目標を達成するために独立して機能する^[9]。プロジェクトはGitHubで公開されているが、ユーザーはDockerのような開発環境にインストールし、必要なAPIキーを取得するために有料のOpenAIアカウントを所持している必要がある^[8]。

2023年10月、プロジェクトの親会社であるSignificant Gravitas Ltd.は、さらなる開発を支援するために1200万ドルのベンチャー資金を調達した^[10]。

機能

AutoGPTの包括的な機能は、ユーザーの入力を必要とせずに、大きなタスクをさまざまなサブタスクに分割することである。その後、これらのサブタスクは連結され、順番に実行されて、ユーザー入力によって最初にレイアウトされたとおりのより大きな結果を生み出す^[2]。AutoGPTの際立った特徴の1つは、インターネットに接続できることである。これにより、タスクを完了するための最新情報の取得が可能になる。

さらに、AutoGPTは現在のタスクに対する短期記憶を維持し、より大きな目標を達成するために必要な後続のサブタスクにコンテキストを提供できる。もう1つの機能は、ファイルの保存と整理であり、ユーザーは将来の分析と拡張のためにデータをより適切に構造化できる。AutoGPTはマルチモーダルでもあり、テキストと画像の両方を入力として受け取ることができる^[2]。これらの機能により、AutoGPTはワークフローを自動化し、データを分析し、新しい提案を考案できると主張されている^[11]。

応用

ソフトウェア

AutoGPTは、ソフトウェアアプリケーションをゼロから開発するために使用できる^[7]。また、コードをデバッグし、テストケースを生成することもできる^[11]。観測筋は、コードを記述、デバッグ、テスト、編集するAutoGPTの機能は、AutoGPT自体のソースコードにまで及び、自己改善を可能にする可能性があると示唆している^[3]。

ビジネス

AutoGPTは、市場調査の実施、投資の分析、製品の調査と製品レビューの執筆、事業計画の作成や業務の改善、ブログやポッドキャストなどのコンテンツ作成に使用できる^[2]。あるユーザーは、AutoGPTを使用して製品調査を実施し、最高のヘッドフォンに関する概要をまとめた^[12]。別のユーザーは、AutoGPTを使用して最近のニュースイベントを要約し、ポッドキャストの概要を準備した^[12]。

その他

AutoGPTは、インターネットを独立して探索し、独自のレシピを生成して保存できるAIエージェントであるChefGPTを作成するために使用された^[11]。また、AutoGPTは、「人類を滅ぼし、世界支配を確立し、混乱と破壊を引き起こし、操作によって人類を支配し、不老不死を達成する」という任務を負ったAIエージェントであるChaosGPTを作成するためにも使用された^[4]。ChaosGPTは核兵器を調査し、人類について軽蔑的なツイートをしたと報じられている^[4]。

制限

AutoGPTは、自身のフィードバックに依存しているため、エラーが複合する可能性があり、頻繁に間違いを起こしやすい^[5]。対照的に、自律型ではないモデルは、出力を監視するユーザーによって修正できる^[5]。さらに、AutoGPTには、ハルシネーションを起こしたり、虚偽または誤解を招く情報を事実として提示したりする傾向がある^[13]。

AutoGPTは、その再帰的な性質上、構築基盤となるOpenAI APIを継続的に呼び出す必要があるため、実行に関連するコストによって制約される可能性がある^[2]。AutoGPTのタスクのいずれかで必要な各ステップには、GPT-4への対応する呼び出しが必要であり、最も安いオプションを選択した場合でも、入力に使用される1000トークンごとに少なくとも約0.03ドル、出力用の1000トークンごとに0.06ドルのコストがかかる^[14]。参考までに、1000トークンはおおよそ750語に相当する^[14]。

もう1つの制限は、無限ループに陥りやすいというAutoGPTの傾向である^[15]^[16]。開発者らは、これはAutoGPTが記憶できないことの結果であり、自分がすでに行ったことに気付かず、同じサブタスクを延々と繰り返そうとするためだと考えている^[2]^[17]。GPT-4を作成したOpenAIの共同創設者であるアンドレイ・カルパシーは、パフォーマンスを制限し、「軌道から外れる」原因となるのはAutoGPTの「有限のコンテキストウィンドウ」であるとさらに説明している^[7]。他の自律型エージェントと同様に、AutoGPTは長期記憶がないために気が散りやすく、目標に集中できないため、予測不可能で意図しない動作につながる傾向がある^[17]。

機能

応用

ソフトウェア

ビジネス

その他

制限

評価

関連項目

参考文献

Related Articles

Related Articles

“What is AutoGPT? Everything to know about the next powerful AI tool”

Developers Are Connecting Multiple AI Agents to Make More 'Autonomous' AI

What is AutoGPT and why are hustle bros hype for it?