Colorless green ideas sleep furiously
From Wikipedia, the free encyclopedia

| 言語学 |
|---|
| 基礎分野 |
| 言語の変化と変異 |
| 理論 |
| 応用分野 |
| 関連項目 |
"Colorless green ideas sleep furiously"(直訳: 色無き緑の考えが猛烈に眠る)は、ノーム・チョムスキーによる例文であり、言語学的な観点から、構文的(統語論的)には正しい、すなわち言語学の専門用語でいう「非文」ではない、にもかかわらず、意味的(意味論的)には意味をなさない(nonsense)というような文の例として提示された。
チョムスキーが初めてこれを書いたのは1955年の論文『言語理論の論理構造』(Logical Structures of Linguistic Theory)であり、1957年刊行の著書『統辞構造論』でも用いられた。前述のような特徴から、統語論と意味論との境界を顕にするという性質を持った文であるとして言語学などで扱われる。カテゴリー錯誤の一例として、当時有力だった統計的モデルへの疑問を示し、より体系的なモデルの必要性を示すために使われた。
チョムスキーは下記のようにこの例を用いた。
It is fair to assume that neither sentence (1) nor (2) (nor indeed any part of these sentences) has ever occurred in an English discourse. Hence, in any statistical model for grammaticalness, these sentences will be ruled out on identical grounds as equally "remote" from English. Yet (1), though nonsensical, is grammatical, while (2) is not grammatical.[1]
- Colorless green ideas sleep furiously.
- *Furiously sleep ideas green colorless.
試訳:
- 色無き緑の考えが猛烈に眠る。
- (非文)猛烈に眠る考え緑の色無き。
文(1)も(2)も(あるいはこれら2文のうちのどの部分も)英語の談話にかつて現れたことはないと仮定することは妥当であろう。ゆえに、いかなる文法的正しさについての統計的モデルのもとでも、この2文は同一の根拠にもとづいて英語から同じくらい"離れている"ものとされ、許容されない。にもかかわらず、文(1)は意味をなさないものの文法的であり(is grammatical)、一方で文(2)は文法的でない(is not grammatical)。
この文が無意味であることがチョムスキーの論点の基盤だと思われがちであるが、そうではなく、どちらの文もかつて一度も具体的には存在していないことをあてにしているのである(統計的モデルとはそういうことである。即ち、既に存在している文からしか、統計的モデルは得られない)。また、誰かが適当で無理のない意味を与えようとも、あるいは、この表現を単独もしくは何かと組み合わせて誰かが口にするのは初めてであっても、そういったこととは無関係に、この2つの例の片方は構文的にありえる文であり、もう片方は構文的にありえない「非文」である、ということは明らかである(ように見える)。そしてこれは、人間の発話が、語の連続の統計といった、表面的な統計的モデルに基づくという見解への反例に用いられた。[要出典]
ただしこれは、チョムスキーが(ないし、生成文法が)コーパスを無視しているあるいは無用としている、ということでもない。「Colorless green ideas sleep furiously.」という文が、生成文法の観点から非文ではない(grammaticalである)ということもまた、字句的に全く同じ文が具体的・直接的には過去に存在していなくても、間接的には、同様な品詞の並びによる文が過去に多数存在していることが、英語の(生成文法による)文法の結局は根拠だからである。つまり技術的には、それを扱うには品詞などの情報が付加された、いわゆるタグ付きコーパスが要る。[要出典]
意味をなす解釈の試み
この文は多義性を通じて解釈しうる。greenもcolorlessも比喩的な意味を持ち、colorlessを「地味な」、greenを「未熟な」との意味で受け取ることが可能である。 その結果「特徴のない幼稚な考えは暴力的な悪夢を持つ」と解釈でき、比較的分かりやすくなる。特にgreenを「出来たばかりの」として、sleepを比喩的に「精神もしくは言葉の休眠」として捉えると論理的な意味も持ちうる。
文脈を通じてこの文に意味を与えようと作家らは試みてきた。この文を成り立たせる文脈を最初に作ったのは中国人言語学者の趙元任である[2] 。1985年にはスタンフォード大学で文学コンテストが開催され、出場者は100語以内の散文かもしくは14行の韻文を使ってチョムスキーの文に意味を与えることが求められた[3]。以下に挙げるものはC・M・ストリートによる出場作品例である。
- It can only be the thought of verdure to come, which prompts us in the autumn to buy these dormant white lumps of vegetable matter covered by a brown papery skin, and lovingly to plant them and care for them. It is a marvel to me that under this cover they are labouring unseen at such a rate within to give us the sudden awesome beauty of spring flowering bulbs. While winter reigns the earth reposes but these colourless green ideas sleep furiously.
- (試訳)秋になると褐色の薄皮に覆われた休眠状態の白い球根を購入し、愛情を込めて埋め、世話をしたくなるのは、萌え出る新緑を想うからに他ならない。驚きだが皮の下で球根は、春になるとすぐに咲き誇れるよう人知れず努力を重ねているのだ。冬が猛威を振るうなか地面は静まり返っているが、この色のない緑の想いは活発に眠っている。
統計学的課題
ペンシルバニア大学のフェルナンド・ペレイラはチョムスキーが設定したような単語頻度を統計モデルとして仮定して議論するのは統計モデルの側を単純化しすぎていて非現実的だとし、より汎化能力のある潜在変数付きのモデルを用いれば、"Furiously sleep ideas green colorless"が"Colorless green ideas sleep furiously"と比べおよそ20万倍現れにくいことを新聞コーパスによる実験を通じて示した[4]。
この統計モデルは類似度測定基準を定義し、その基準により、ある点でコーパス内の文に比較的類似した文は、より類似度が低い文よりも高い値が代入される。ペレイラのモデルは同じ文でも統語的に正しい形より非文法的な物により低い可能性を割り当てた。このことから統計モデルは文法性の特質を最低限の言語学的仮定で記憶させることが可能であると証明した。しかし、あらゆる非文法的な文にあらゆる文法的な文に比べて低い可能性を割り当てるかは不明である。つまり"colorless green ideas sleep furiously"は依然として統計上ほかの非文法的な文と比べ英語から"離れている"可能性がある。これについて、全ての英語の文法的な文と非文法的な文を区別することのできる文法理論は現時点では存在しない。[要出典]
