チョムスキー「文法の構造」随想
要約+わからなかった部分
高校の頃からの友人の佐藤タダヨシがチョムスキーに興味があるというので、最近言語学に興味を持っている僕は良い機会だと思い、一緒にSyntactic Structuresを読み進めることにした。その際、簡単な要約と疑問点をまとめたのだが、まだ結論の出ていない疑問点もあるので無くしてしまわないようにここに掲載しておく。
■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■
要約
1.Introduction
★ 構文論とは、与えられた言語に対し、文が生成される原理と
仕組みを明らかにしていく学問である。
★ 構文論研究の究極の目標は、特定の言語に限定されない、
普遍的な言語理論を打ち立てることにある。
★ 言語学においては『言語的なレベル』の概念が重要である。
すなわち言語は音韻論 phonemics、形態論 morphology、
句構造 phrase structure などの複数のレベルから構成される。
この研究では、英語における適切な文法が少なくとも三つのレベルを
持たなくてはならないことが主張される。
2.The Independence of Grammar
★ 言語 a language は『有限の要素(アルファベット等)から作られる、
有限の長さの文の(有限または無限)集合』として定義される。
★ 文法とは、言語という集合における『文法的な文 grammatical sentences』と
『非文法的な文 ungrammatical sentences』を分ける道具 device である。
★ 文法的に間違った文と、意味論的に間違った文とは異なる。
文法は、言語学における独立した対象である。
★ 『文法的である』とは、文が発話の中で統計的に起こりやすいことと
まったく異なる概念である。
3.An Elementary Linguistic Theory
★ 『文法的な文』が有限個の場合には、それらの文を羅列するだけで文法になる。
しかし、無限個の『文法的な文』を含む言語の場合、文法を羅列によって表すことは出来ない
そこで、一般に文法は『文法的な文』を生成していく『手続き』の形をとる。
★ 一番簡単な文法として、『有限状態言語 finite state language』の文法がある。
この文法は、起点と終点を持つ有向グラフとして表される。ひとつひとつの枝が単語と対応する。
起点から出て終点に入るまでの各経路が『文法的な文』とみなされる。
★ この文法が有限個の『文法的な文』しか作り出さないのであれば、
わざわざ使用する必要はない。『文法的な文』を羅列すれば良いだけの話である。
この文法は無限種類の文を作り出せるが、それはループの存在を許すためである。
ループを任意回通ってから終点に向かう、ということが可能なため、無限種類の文を作り出せる。
★ しかしこの文法では『if が来たら、後でthen が来なくてはならない』
『either が来たら、or が後の方に出てこなくてはならない』
といった規則をモデル化することが出来ない。
状態から状態へ移動するだけであって、過去の状態を記憶する機構が無いのである。
離れた場所にある単語同士の対応関係をモデル化するには、有限状態言語では不十分である。
4.Phrase Structure
★ 離れた場所にある単語同士の対応関係をモデル化するためには、
句構造 phrase structure の文法が必要である。
Sentence という記号から初め、与えられた規則を用いて
記号を別の記号の列に書き換えていく。そうして得られる文を『文法的な文』と
定義するのが、句構造の文法である。
★ 句構造の規則の適用結果は、導出図 derivation diagram の形で
図示することが出来る。
★ 規則には、抽象的記号を別の抽象的記号に書き換えるものと、
抽象的記号を音素列に書き換えるものとがある。
後者は形態素音韻論 morphonemics と呼ばれる。
5.Limitations of Phrase Structure Description
★ 句構造では、ひとつの記号を記号列に書き換える規則しか許さない。
同一の述部を持つ二つの文が and でつなげられる場合、
述部がひとつにまとめられることが起きる。まとめられた文も文法的である。
句構造では、このような変形を表現するのが困難である。
(不可能とは言い切っていないところが僕は面白いと思った)
そこで、記号列を記号列に書き換える規則(=変形 transformation)が求められる。
このような気即を含めた文法を、変形生成文法と呼ぶ。
★ 変形によって、二つの文を and でつなげる変形や、
能動態から受動態への変形、動名詞などを『文法的な文』として
作り出せるようになる。
★ 変形生成文法は、@句構造、A変形、B形態音韻論、の三段構えである。
6.On the Goals of Linguistic Theory
★ 言語理論(言語学の一番大きな枠組み)について、三つの考え方がある。
@ 入力:コーパス(実際に使われた文の集合。新聞記事やテープレコーダーの記録など)
出力:文法
A 入力:コーパス+文法A
出力:文法Aの可否
B 入力:コーパス+文法A+文法B
出力:文法Aと文法Bの間で、どちらが良いかの判定。
ここではBの立場をとり、言語理論は文法間の優劣を決められれば充分とする。
また、言語理論自体も、文法との相互作用によって変わっていくものとみなされる。
7.Some Transformations in English
★ 疑問文や否定形が簡単な変形の規則によって生成されることを示す。
疑問文における do の出現(例:which do you like?)と
否定形における do の出現(例:I don't like it.)を同じ規則で扱えることも、
変形生成文法に対する裏付けとされる。
★ 変形生成文法の理論は
John come home.
の home が 名詞句ではないことを主張するなど、
従来の句構造に変更を迫ることもある。
しかし、句構造を固定した上で変形を考えるのではなく、
両者を共に改良しつつ、より良い文法を作っていくのがここでの目的であるため、
問題はない。
8.The Explanatory Power of Linguistic Theory
★ 人間が語や文に対して感じる両義性 ambiguity は、
言語理論のレベルが上がるにつれて説明されていく。 たとえば、
@ /∃neym/は、音韻論 phonemic の立場からはひとつの音素列である。
形態素 morpheme の理論(つまり『単語』という概念)を用いた時に初めて、
『a name、および an aim という二つの異なる形態素列が
いずれも/∃neym/という音韻列によって表されている』
という両義的な事態を表現できる。
(∃は、曖昧母音のつもり。eを逆さにしたやつ。∃で代用してみた)。
A old men and women は、old が men に掛かるのか、
men and women に掛かるのかで、二通りの読み方が出来る。
すなわち両義性が存在する。だが形態素のレベルには
「掛かる」の概念が無いため、この両義性を表現することが出来ない。
これを表現するためには、「掛かる」の概念を
導出図 derivation diagram の形で表現できる句構造 phrase structure の
理論を待たねばならない。
B the shooting of the hunters は、the hunters が撃ったともとれるし、
the hunters を撃ったともとれる。句構造では the hunters が the shooting に
掛かっているだけであり、一種類の導出図しか得られない。
一方、変形 transformation を用いれば、この文が
the hunters shoot と someone shoots the hunters の二種類の
中核文 kernel sentence まで至れることが言え、両義性をモデル化できる。
このことから、変形生成文法は高い説明力を持った理論であることが主張される。
9.Syntax and Semantics
★ 文法が意味の理論に依存するという主張に対し、反論が行なわれる。
★ 「意味の理論から独立した文法など、可能なのか」という問いに対し、
「意味を踏まえた文法など、これまでにあったのか」と答える。
★ 文法が意味論の上に成り立つべきであるとする主張の背景には、
意味論の方が文法よりも単純であり、既に確立されているという
(誤った)考え方がある。
10.Summary
★ 全体の要約。
■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■
よく分からなかった部分。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
@ pg17、下から11行目以降。
つまりSection 2 の補注番号4。
「初めのn語がS_{1}と一致し、終わりのn語がS_{2}と一致するような文字列が、
あらゆるnについて存在する(S_{1}とS_{2}は共に文法を満たすが、同一ではない)」
ということが、なぜ
「文法を、言語の統計的傾向と結びつけて考えようとする試みがうまくいかない理由」
になるのかが分からない。
==================
《友人タダヨシからのメール》
> そうだな。そこはよく分からんな。
> そもそも、"the man who ... are here,"という
> 例文はS_{1}と頭のn文字が一致して、S_{2}と尻のn文字が一致する
> 文字列の例として出されているんだよね。ちょっと気になったのが、
> この文主語がthe manなのにbe動詞がareになってるよね。これは、
> grammaticalなのか?
《テヅカの返信》
日本語版の補足説明に、以下のような記述があった。
僕は the man と are の不一致については迂闊ながら気付いておらず、
下の文章を読んで初めて知った。
以下、引用。
−−−−−−−−−−−−−−−−−−−−−−
[ここの脚注について訳者の質問に答えて Chomsky 氏は訳者への私信に
次のように書いている(April 4, 1960):
"... In fn.4, p17, I wanted to point out that dependencies in
language extend beyond any fixed bound, and that therefore any
model based on transitional probabilities must fail. The sentence form
"the man who ... are here" illustrates this in the following way.
Pick any integer n that you please. We can find a phrase with n words
that can replace the dots in this example leading to a non-sentence,
the first n words of which are the beginning of some sentence and
the last n words of which are the end of some sentence. E.g. pick n=7.
We can fill in the dots with the phrase "that fellow pointed out to me
yesterday". The result is the non-sentence "the man who that fellow
pointed out to me yersterday are here." But the first 7 (in fact, the
first 10) words of this culd be the beginning of a sentence, and the
last 7 (in fact, the last 10) words could be the ending of a sentence.
This is enought to prove this point, and explains why I used "are"
instead of "is" here ..."]
−−−−−−−−−−−−−−−−−−−−−−
続いて、僕なりの分析。
transitional probabilities というのは・・・遷移確率?。
『語aの次に語bが現れる確率』とか?。
そのようにモデル化すると、ある文が現れる確率を、
Π_{n=1..k-1}P(w_{n},w_{n+1})
という形で表現できるのかも知れない。ただし、
k=文に含まれる語の数
w_{n}=文中でn番目に現れる語
P(a,b)=語aの次に語bが現れる確率
ところがこれだと、非文法的な文
"the man who that fellow pointed out to me yersterday are here."
と文法的な文 S_{1} の間で、最初のn語について遷移確率が一致し、
"the man who that fellow pointed out to me yersterday are here."
の後半(つまり尻からのn語)についても、文法的な文 S_{2} と遷移確率が一致する。
S_{1} および S_{2} として、適当に長い文を考えてやれば、それらの方が
"the man who that fellow pointed out to me yersterday are here."
よりも現れる確率が低い、という状況を作れる。
非文法的なのは "the man who that fellow pointed out to
me yersterday are here." の方だから、それが文法的な文
S_{1} と S_{2} よりも出現確率が高いということになり、
統計的研究と文法とが異なることを示せる・・・
といったところだろうか?。
しかしこの考え方だと、なぜ頭の一致と尻の一致を
n で統一しなくちゃいけないのかが、うまく説明できない気がする・・・。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
A pg45、上から3行目。
つまりSection 5.5の3段落目の最後の方
"analysis of NP_{sing}" が何を指しているのかが分からない。
別の場所で説明されていたのに、忘れてしまったのかな?。
また、analysis of NP_{sing}が規則34の後に来なくちゃいけない理由も分からない。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
B pg74、上から8行目以降。
つまりSection7.3の5段落目。
"Sleeping" は Adjective として扱われる時もあれば、
そうでない時もあるとされている。その間の判定基準は何?。
ひょっとして、Adjective として使われる場合と使われない場合があるのは、
規則77の前と後のどちらで規則が行なわれるかの違いから来ている?。
つまり、規則77より前で適用される規則は
sleeping を adjective と扱わないが、規則77より後で適用される規則は、
adjective として扱うということ?。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
C pg95、上から18行目以降。
つまりSection9.2.3の2段落目。
A weaker claim の主張していることがわからない。
==================
《和訳本を参考に再検討してみた結果》
「ひとつの音素列がひとつの意味と対応する」
ではなく、
「ひとつの音素列がひとつの意味集合(=ambiguous meaning)と対応する」
と言い換えるということかな。
そのような「意味集合」を確定するのにすごい労力がかかるから、
やめておいた方がいい、といったところだろうか。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
D pg98、上から1行目以降。
つまりSection9.2.5の全体。
何を言いたいのかがわからない。
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■
タダヨシからの質問と、僕なりの答え。
−−−−−−−−−−−−−−−−−−−−−−−−−−
> 2.1の後半の意味
僕の理解は、以下の通りです。
観察された文集合 observed sentences の中には、
A.『こいつは文法的に正しい』と確実に感じられる文
B.『こいつは文法的に間違っている』と確実に感じられる文
C.『こいつは文法的に正しいか正しくないかよく分からない』と感じられる文
の三種類がある。そんな時、
「文法を作る前に、Cの中身をぜんぶ白黒つけなきゃ」
などと考えていたら、キリがない。
むしろ、Aの中身すべてを作り出せる文法を作ってみて、
これを利用してCに白黒つけていく方が効率的である。
ところがそんな風にして作られた文法は、それほど説得力が無かったりする。
なぜなら、Aをすべて作り出すような文法には、いろいろな可能性があるから。
いくつかの異なる文法を用いて、Aの中身をすべて作り出せる。
「なぜその文法を選んだの?」と言われると、答えに窮する。
そこでチョムスキーは、『言語理論による多言語の文法の統合』という裏づけを持ち出す。
つまり、ひとつの言語に対する文法だけを論じていても説得力がないから、
たくさんの言語について文法を作ってみて、しかもそれらの文法が共通の
「言語理論 linguistic theory」によって「良い」と評価されることを示す。
これによって、個々の文法の説得力と、言語理論の説得力とが共に増す。
つまり、以下のような三段構えになっている。
@実際の文集合 observed sentences
A文法 grammar
B言語理論 linguistic theory
言語理論というのは「文法の適切性を評価するシステム」という意味みたい。
くわしくは6章で説明されている。
つまり、様々な文法を作り出し、評価していく包括的な体系を意味しているのだと思う。
たとえば『文法に対する簡潔さ simplicity の評価基準』などが
含まれているのじゃないかなと僕は思っている。
“変形生成文法の考え方”というのも、
「変形という操作は簡潔である」という評価基準であり、
言語理論の一例と言えるのではないかと思う。
結局、
「私の言語理論に基づいて採用された英語の文法は
たくさんの『(英語において)文法的に正しい文』を作るし、
私の言語理論に基づいて採用されたドイツ語の文法も
たくさんの『(ドイツ語において)文法的に正しい文』を作る。
だから私の言語理論には説得力があるし、
それに基づいて作られた英語やドイツ語の文法にも説得力がある」
ということが言いたいのではないか。
喩えて言うなら、ニュートン力学が
@ ケプラーの三法則
A ガリレオの自由落下の法則
の両方を作り出すから説得力がある、とするのと同じ構造だと思う。
℃ Taro Tezuka (2002.8.25)
Syntactic Structuresに対する随想
チョムスキーのSyntactic Structuresを読んでいるのだが、第8章"The explanatory power of linguistic theory"で論じられている、『(直観的に感じられる)ambiguityを説明するために言語理論のレベルを上げていく』という発想が興味深い。
チョムスキーが挙げている例。
@ /∃neym/は、音素学phonemicの立場からはひとつのものである。形態素morphemeの理論が入った時に初めて、『a とname、an とaimという二つの異なる形態素ペアが、いずれも/∃neym/という音韻によって表される』というambiguousな事態を表現できる。
A old men and womenは、oldがmenに掛かるのか、men and womenに掛かるのかで、二通りの読み方が出来る。すなわちambiguityが存在する。だがmorphemeのレベルには「掛かる」の概念が無いため、ambiguityを表現することが出来ない。このambiguityを表現するためには、「掛かる」の概念をderivation diagramの形で表現できるPhase structureの理論を待たねばならない。
B the shooting of the huntersは、hunterが撃ったともとれるし、hunterを撃ったともとれる。phase structureの上ではthe huntersがthe shootingに掛かっているだけであり、一種類のderivation diagramしか得られない。Transformational levelに至って初めて、hunters shootとsomeone shoots huntersの二種類のkernel sentenceにtraceできることが言え、ambiguityをモデル化できる。
Ambiguityは直観的に認識されるものである。チョムスキーによれば、言語理論はそれらの直観を説明するべく発展していく。言語学をコーパスに対する統計的解析に留まらせず、直観的な適切・不適切の判断を積極的に利用しようとした彼の立場が現れていると言えよう。
直観との適合性によって理論を発展させていく、というのは学問の定石のひとつだとは思うが、その中でも特にambiguityの認知を用いる手法が、どこか他の分野でも使えないものかと思った。
実際、変形生成文法でも説明できないambiguityが存在すると思う。その場合、さらに高いレベルの理論を求めていくのだろうが、それはもはやsyntaxではなく、semanticsに属すことになるのだろうか。
℃ Taro Tezuka (2002.8.6)
トップページに戻る