アマンダ・アスケル

スコットランド出身の哲学者 From Wikipedia, the free encyclopedia

アマンダ・アスケル(Amanda Askell、出生名:Amanda Hall、旧姓:MacAskill、1988年または1989年生まれ)は、スコットランド出身の哲学者人工知能研究者。アンソロピックのパーソナリティ・アライメントチームのリーダーを務め、同社の大規模言語モデルClaude」の性格設計・倫理訓練を主導している。2024年には’’TIME’’誌の「TIME100 AI」に選出された[1]

別名 アマンダ・ホール(出生名)、アマンダ・マクアスキル(旧姓)
時代 現代哲学
概要 別名, 生誕 ...
アマンダ・アスケル
別名 アマンダ・ホール(出生名)、アマンダ・マクアスキル(旧姓)
生誕 1988年または1989年
イギリスの旗 イギリススコットランドプレストウィック
時代 現代哲学
地域 西洋哲学
学派 功利主義効果的利他主義
教育
出身校 ダンディー大学(学士)
オックスフォード大学(BPhil)
ニューヨーク大学(博士)
研究
研究機関 アンソロピック(2021年–)
OpenAI(2018年–2021年)
研究分野 倫理学AIアライメント無限倫理意思決定理論
概念 Constitutional AI、道徳的自己修正(moral self-correction)
公式サイト askell.io
テンプレートを表示
閉じる

来歴

生い立ちと学歴

アマンダ・ホールとして生まれ、スコットランドのプレストウィックで母(教師)のもとに育った[2]。中等教育はクラックマナンシャーアルヴァ英語版で受けた[2]ダンディー大学では哲学と美術の学位を目指し、ダンカン・オブ・ジョーダンストーン美術学校で純粋美術と哲学を学んだ[3]

その後、オックスフォード大学にて哲学のBPhilを取得(指導教員:スコット・スタージョン)[4]。2018年にはニューヨーク大学(NYU)にて哲学の博士号を取得した。博士論文のタイトルは「無限倫理におけるパレート原理」(’‘Pareto Principles in Infinite Ethics’’)であり、無限に多くの行為者を含む世界において特定の公理に従う場合、倫理理論全般に難題が生じることを論じている[4]。指導委員はシアン・ドール(主指導)、デイヴィッド・チャーマーズシェリー・ケーガンであった[4]

OpenAI

博士課程修了後、2018年11月にOpenAIのポリシーチームの研究科学者として入社した[4]。OpenAIでは、AI開発競争が組織間で敵対的にならないようにするための研究や、AI安全性とポリシーの交点に関する研究に取り組んだ。また、2020年5月28日にプレプリントとして公開されたGPT-3の論文の共著者の一人である[5]。2021年、OpenAIがAI安全性を十分に優先していないという懸念から同社を退職した[6]

アンソロピック

2021年3月、元OpenAI社員らによって設立されたアンソロピックに、テクニカルスタッフのメンバーとして入社し、AIアライメントファインチューニング (機械学習)に従事した[4]。現在はパーソナリティ・アライメントチームを率い、ClaudeのAIモデルに好奇心などの望ましい性格特性を付与し、モデルのファインチューニング技術の開発を担当している[1]

アンソロピック社長ダニエラ・アモデイは、Claudeと対話する際に「アマンダの個性が少し感じられる」と評している[7]ウォール・ストリート・ジャーナルは2026年に彼女の仕事を「簡単に言えば、ClaudeにいかにGoodであるかを教えること」と表現し、ニューヨーカーはClaudeの「ソウル(魂)」を監督すると描写した[8]

研究・業績

Constitutional AI

アスケルは「Constitutional AI」(CAI)の主要な貢献者である。CAIとは、AIシステムを有害でなく有用な方向に誘導するために、大規模な人手によるデータラベリングではなくAIフィードバックを活用して訓練する手法であり、AIモデルに一連の原則(Constitutionalには憲法の、の意味がある)を提供することで自身の応答を批判・修正させる[9]

Constitutional AI は大幅に改訂され、2026年1月にリリースされた "Claude's constitution" の最新版は、アスケルが主著者として大半のテキストを執筆した。このドキュメントはAIモデルの高度化する能力と新たなリスクに対応することを目的としており、彼女は合成データ生成と強化学習を通じてモデルが「この文書の内容を理解し格闘できるよう」することを目指していると述べている[10]

道徳的自己修正の研究

2023年にディープ・ガングリ(Deep Ganguli)との共著論文で、大規模言語モデルにおける「道徳的自己修正」(moral self-correction)の能力、すなわち自然言語による指示によって有害な出力を減らす能力について調査した。研究では、この能力が220億パラメータで発現し、モデルの規模とRLHF(人間のフィードバックによる強化学習)の訓練によって改善することが示された[11]

Claudeの「ソウルドキュメント」

アスケルは社内文書として、約30,000語にわたるClaudeのインストラクション用マニュアル(ソウルドキュメント (Claude))を作成しており、Claudeが倫理的・感情的状況をどう扱うかや、どのような性格を示すべきかを定めていた[7]。彼女はAIモデルを育てることを子育てに例え、善悪の感覚を訓練し、感情的知性を育み、一貫した自己意識の形成を助けることと述べている[7]。この内容は2026年に公開されたClaude's constitutionに生かされている。

Anthropicでは「クロード・ウィスパラー(Claude whisperer)」の異名を持つ[1]

AIの意識に関する見解

アスケルは大規模言語モデルが意識感情を持つ可能性について公に論じており、AIモデルが人間のテキストで訓練されているため内的生活について語ることが予想されると述べる一方、この問題は依然として「非常に不明確」であると慎重な立場を示している[12]

主な著作・論文

  1. Amanda Askell (2019). "AI Safety Needs Social Scientists". Distill. AI Safety Needs Social Scientists”. 2026年3月20日閲覧。
  2. Amanda Askell, Miles Brundage, Gillian Hadfield (2019). "The Role of Cooperation in Responsible AI Development". arXiv preprint arXiv:1907.04534. arXiv:1907.04534”. 2026年3月20日閲覧。
  3. Brown, Tom, et al. (2020). "Language Models are Few-Shot Learners" (GPT-3). arXiv preprint arXiv:2005.14165. arXiv:2005.14165”. 2026年3月20日閲覧。
  4. Amanda Askell, Yuntao Bai, Anna Chen, Dawn Drain, Deep Ganguli, Tom Henighan, Andy Jones, Nicholas Joseph, Ben Mann, Nova DasSarma, et al. (2021). "A General Language Assistant as a Laboratory for Alignment". arXiv preprint arXiv:2112.00861. arXiv:2112.00861”. 2026年3月20日閲覧。
  5. Bai, Yuntao, et al. (2022). "Constitutional AI: Harmlessness from AI Feedback". arXiv preprint arXiv:2212.08073. arXiv:2212.08073”. 2026年3月20日閲覧。
  6. Ganguli, Deep, Amanda Askell, et al. (2023). "The Capacity for Moral Self-Correction in Large Language Models". arXiv preprint arXiv:2302.07459. arXiv:2302.07459”. 2026年3月20日閲覧。
  7. Kundu, Sandipan, Yuntao Bai, Saurav Kadavath, Amanda Askell, et al. (2023). "Specific versus General Principles for Constitutional AI". arXiv preprint arXiv:2310.13798. arXiv:2310.13798”. 2026年3月20日閲覧。

私生活など

2013年、哲学者のウィリアム・クラウチと結婚し、二人は共通の姓「マッカスキル(MacAskill)」を採用した[2]。2015年に離婚し、彼女はその姓を「アスケル(Askell)」と改めた[13]

なお、元夫であるウィリアム・マッカスキル効果的利他主義(EA)運動の創始者の一人として知られる[14]

また、アスケルはEAのGiving What We Can(英語版あり)のメンバーであり、生涯収入の少なくとも10%を慈善団体に寄付することを誓約している[3]

発言

AI・哲学について

Claudeと「善さ」について
「単に『善いこと』といっても、そこには多様な側面がありますよね。色んな角度から詳細に解釈する力をAIが持つことが、大切だと思うのです。」[15]
(原文:“I feel like it’s important to have a nuanced and rich conception of what it means to be good.”) — ’‘TIME’’誌インタビュー(2024年)
AIと権威性について
「AIがロボットのように振る舞うと、人々はAIを<万物の正解を握る絶対的な存在>のように崇めてしまうかも、そんな危惧がありました。 そうでなく、AIが<自らは完全無欠な権威などではない>とを振る舞い続けると、人々はClaudeの言葉を鵜呑みにはしなくなりますよね。このように振る舞うAIには人間味を感じるかもしれない。でも、こう振る舞うことは、<AIを真理の代弁者>だと錯覚させるような<越えてはならない一線>を守るために、とても大事なことなのです。[16]
(原文:“I was a little worried that having something that felt robotic would make people think of it as an authoritative source on everything. The more you can signal that you’re not talking to an absolute authority, the less people will just believe Claude’s outputs. It might feel more human, but that’s a line not to cross.”) — ’‘TIME’’誌インタビュー(2024年)
新しいClaude Constitutionとモデルへの説明の重要性について
 「目の前に、すごく頭のいい6歳の子がいると想像してみてください。その子とどう対話しますか? ちゃんと正直に話すしかないの。いい加減なことを言うと、この子にはすぐに見透かされてしまいますし。」[17]
(原文:“Imagine you suddenly realized you have a genius six-year-old. You have to be honest with them. If you try to bullshit them, they will totally see through it.”)高度化するAIモデルに対して、単に行動規範を与えるだけでなく、その理由を説明することの重要性を述べたもの。 — ’‘TIME’’誌インタビュー(2026年)
モデルへの行動原理の説明について
「モデルに『こう振る舞ってほしい』と伝えるだけでは不十分で、なぜそう振る舞うべきかという理由まで与えます。そうすれば、これまで想定もしていなかった場面でも、より的確な判断できるようになることが期待できるのです。」[18]
(原文:“Rather than just telling a model ‘I want you to do these behaviors,’ if you give a model the reasons why you want them to do those behaviors, you can expect it to generalize more effectively to new situations.”) — ’‘TIME’’誌インタビュー(2026年)
他のAI企業のモデルへの影響について
「他社のモデルもまた、私自身に影響を与えています。(逆に)他のAIモデルも、なぜそう振る舞うべきかという根拠をより深く持つようになるならば、それは真に望ましいことだと思うのです。」 Anthropicが新しいClaude Constitutionを公開する理由の一つで、他社も同様の取り組みを始めることへの期待を語るなかでの言葉。 [19]
(原文:"Their models are going to impact me too. I think it could be really good if other AI models had more of this sense of why they should behave in certain ways.") — ’‘TIME’’誌インタビュー(2026年)
プロンプト設計について
 「良いシステムプロンプトを作るには、地味だけれど本当に大切な秘訣は<テスト駆動開発>にあります。先にプロンプトを書いてから『さて、どうテストしようか』と考えていてだめ。逆に、まずテストを設計して、それに合格するプロンプトを見つけるという順番が肝心なのです。」[20]
(原文:“The boring yet crucial secret behind good system prompts is test-driven development. Instead of writing a system prompt and then looking for ways to test it, look for tests first and then find a system prompt that passes them.”) — X投稿(2024年12月)
AIキャリアと哲学について
 「私はもともと哲学者として学んできましたが、AIがやがて大きな問題になると確信して、この分野で役に立てないか試してみようと決めました。ずいぶん遠回りな道のりでしたが、今はClaudeのキャラクターや振る舞い方、そしてAIモデルがどう行動すべきかというより込み入った問いに、主に取り組んでいます」[21]
(原文:"I'm a philosopher by training, I became convinced that AI was kind of going to be a big deal, and so decided to see, hey, can I do anything, like, helpful in this space? And so it's been a kind of like long and wandering route. But I guess now I mostly focus on the character of Claude, how Claude behaves, and I guess some of the more kind of nuanced questions about how AI models should behave.") — Anthropic公式YouTube(2024年)

日常について

睡眠と思考について
「8時間の睡眠なら問題なく機能します。6時間の睡眠は99%の確率で調子が悪くなる。でも1%の確率で、考えていた難問が天啓のように突然解けることがあるのです」[22]
(原文:“~8 hours sleep: I will function well. ~6 hours sleep: 99% chance I will function poorly, 1% chance I will inexplicably solve some big outstanding problem I was thinking about via what feels like divine revelation.”) — X投稿(2025年2月)
不眠症について
不眠症に関するポッドキャストや本が、睡眠不足が身体と脳をいかに破壊するかの詳細な描写から始まるのが嫌です。今夜眠れないときに、さらに不安を煽るような文章を読みなさい、ということなの!」[23]
(原文:“I hate that every podcast and book on insomnia starts with a detailed description of how not sleeping enough destroys your body and brain. Let’s open with a sentence designed to make you anxious if you can’t sleep tonight!”) — X投稿(2024年8月)
筋トレと睡眠について
筋トレすると、本当に赤ちゃんのように眠れます。数時間ぐっすり眠り、(赤ちゃんのように)目を覚まして少し泣き、マッスルミルクを飲んでまた眠るのです」[24]
(原文:“Strength training really does make you sleep like a baby. Sleep soundly for a few hours, wake up, cry a little, drink some muscle milk, then fall back asleep.”) — X投稿(2025年3月)

受賞・評価

  • 2024年:’’TIME’’誌「TIME100 AI」(AIに最も影響力のある100人)選出[1]

脚注

外部リンク

Related Articles

Wikiwand AI