言語誕生のマイスタージンガーモデル（後編）

顧問の西川伸一を中心に館員が、今進化研究がどのようにおこなわれているかを紹介していきます。進化研究とは何をすることなのか？歴史的背景も含めお話しします。

バックナンバー

音節と記憶の連合（Lexicon:語彙は、連合させて記憶を高めるメモとして 始まった。）

話題をガラッと変えて、次は記憶について考えてみよう。私たちには瞬間ごとに、膨大な量の情報が感覚を通して入ってくる。これら全てを記憶することは不可能だし、ほとんどは意識にすら上ることなく通り過ぎる。意識されるのは、各人が経験で形成してきた独自の基準とその時の脳の状態に照らして選択された表象だけで、この時の選択を行う基準を、「自己」と呼んでいいと思うが、自己の表象自体も刻々変化する脳内ネットワークだ。

感覚を通して入ってくる情報 の中から特定の表象を選択して記憶しているとは言っても、物事を正確に覚えているのは難しい。我々の感覚の７割は目を通して入ってくるが、例えば初めての美術館を巡って外へ出た瞬間、目の前にもう一度イメージを思い浮かべられる絵は何枚あるだろうか。実際、覚えられないのが当然で、絵を見るとき私たちが画像をどのように脳内に表象しているかを考えれば、覚えていることの方が奇跡だ。実際には、絵の様々な場所に視線を走らせて、そうして得られた各部分の表象を、形、色など様々な要素に分解し、それを脳内の異なる部分に維持した上で、もう一度脳の中で表象へと統合し直す。すなわち、絵を見ている瞬間として認識している体験も、実際には細切れになった様々な表象を脳内各所に維持し、それを再統合したものをある瞬間に見た画像だと認識しているだけだ。この過程は、作業記憶と呼ばれているが、この複雑な過程を何回も繰り返すのが絵画の鑑賞になる。とすると、情報量が多すぎてなかなか記憶に残らないのも当然だ。しかし見た瞬間、なぜか深い感動を覚える絵は間違いなく記憶している。これは複雑な視覚の表象でも、感情という単純な表象と連合させると覚えやすいからだ。もちろん、連合相手は感情だけではない。何か単純なシンボルとうまく連合させれば記憶が容易になることは多くの人が経験していると思う。美術館で写真を撮ったという記憶があると、その絵を覚えている確率が高まるという研究があるが、これも写真を撮るという簡単な表象と連合させているからだ。

匂い、音、驚き、恐怖の経験など、感情的表象は記憶を容易にする連合相手の定番として実際使われているが、短い音節も記憶に残りやすく、連合相手として優れていのではないだろうか。私たちはすでに言語を持っており、言語に似た音節を個人的な記憶を高めるための個人的メモ代わりだけに利用している原始的状況を想像できない。しかし、私たちの記憶に、実際の事物の表象と音節を持ったシンボルとしての単語の表象の連合は大きな役割を果たしており（固有名詞と顔の表象を考えてみてほしい。言語的連合があると覚えることができる）、個人的に、特定の音節を連合させて 記憶を高めるために使うことは十分あり得るのではないかと思っている。言語が誕生する前は、この音節と事物の表象との連合は偶然結びついただけで、シンボルとして表象に固定されているわけではないし、ましてや他の個体や社会と共有しているわけではない。しかし私たちの脳内には、語彙とは全く別に様々な事物についての表象が階層的に形成されている。例えば、食べられるもの、食べられないもの、甘いもの、しょっぱいもの、といったカテゴリーだ。この表象に、音節がいったん連合されると、当然その音節は、頭の中に形成されている複雑な表象のネットワークに統合される。

もう少し具体的に見てみよう。言葉を持たない原人でも、獲物の鹿が見つかった時には思わず声が出る。この声になって出た「ディア」といった音と鹿と周りの景色を連合させたとしよう。すると、この「ディア」という音は、鹿を見つけた経験の表象と個別に連合されるが、これにより原人の頭の中にあるほとんどの表象のネットワークに組み込まれたことを意味する。例えば「ディア」という音節は鹿とその周りの景色というだけでなく、ライオンとは違うこと、食べれば美味しい、あるいはもっと大きなカテゴリー、４つ足の動物などの表象とも関連することになる。

連合による明瞭な記憶は自己自身の表象の確立に始まった。

図1　昨年出版された、Murray, Wise, Grahamの３人の共著による記憶の進化についての著書『The evolution of memory system』。進化という観点で記憶を捉えた本としては初めてではないだろうか。

上記のように、物事を明瞭に覚えるためには、関係のない表象を連合させられる能力が必要になる。異論もあると思うが、このような能力が人類だけに発達したと考える研究者は多い。中でもエリザベス・マレー（Elisabeth Murray）等によって最近出版された『The evolution of memory system』では、明瞭なexplicit memoryと呼ぶ明瞭な記憶を形成する能力は人類にしかなく、類人猿を含む動物では発達していないと主張されている（図1）。というのも、explicit memory形成には、新しい連合とそれを統合する脳の仕組みが必要で、具体的には考え行動している自己を身体認識とは切り離して表象し直し、エピソード記憶形成過程で、一旦分解された感覚からの表象を、もう一度統合する基準にすることが、人類だけで可能になったからだと主張している。一種の、主観的意識のようなものだと思うが、説得力のある主張だ。

動物にexplicit memory（顕在記憶）やsemantic memory（意味記憶）があるのかないのか、全く判断できないが、それでもこの本の指摘は言語を考えるためには重要だと思う。というのも、自分が発生した音節を、全く無関係のエピソード記憶と連合させ記憶を鮮明にする、音節をメモ代わりに使う能力は、explicit memoryを可能にする能力と完全に重なるからだ。この本では、言語であれ、新しい文明であれ、すべては人類だけが獲得した、explicit memory形成能力に起因するとまで提案している。確かに、homo sapiensが生活していた洞窟に残された動物の絵は、明瞭な記憶なしに描くことはできない。

さらに、カテゴリー化の能力や、全く無関係な表象を連合させる（例えば母親(mother)、と自然（mother nature））semantic memoryも内的自己の表象を、様々な表象を連合させる基準に据えることで可能になったと考えられる。要するに、偶然であっても、自分を中心に全く関係のない表象と表象を連合させる能力は言語発声にとって必須の条件になる。

しかし特定の音節をいくら頭の中の様々な表象と階層的に連合させられるとしても、その過程を他の個体と共有できているわけではない。言語発生には、この音節と事物の表象の関係を複数の個体が共有する必要がある。この問題については最後に議論する。

行動の表象が文法を決める

言語発生前の話をしていることを再確認しておく。したがって、ここで議論している言語は、たかだか語彙が１００にも満たない原始的なものだと考えておいてほしい。この状況を念頭に次に文法について考えてみよう。

３歳前後に、最初に自発的言葉を話すようになっても、使う単語は３−４語程度だが、例えば「水・飲みたい」とか「表・出たい」、あるいは名詞を並べて「ママ・今・部屋」などだ。重要なことは、誰が聞いても意味が十分くみとれる言葉を話している点だ。これをもって、普遍文法構造が脳内に形成されていると結論しても悪くはないが、このような幼児の言葉の統語を、私たちが何かをするときかならず頭の中に形成する行動の表象に従って単語が並べられている結果と考える可能性はないだろうか？私たちの行動は、時間的にも、空間的にも様々な制約を受けている。この行動に対する制約は、一つは意識には登らない手続き記憶とし、もう一つは意識された行動の記憶として脳内に表象されているはずで、原始的な言語ではこの表象がそのまま統語のルールとして使われている可能性がある。

実際、運動と文法の間に関連があると考えられる現象は存在する。この関係が最も明確に見えるのが、運動の中枢、小脳の障害により起こる失語だ。小脳性の失語は、有名なブローカ失語やウェルニッケ失語とは症状が異なり、Agrammatism（失文法）と呼ばれる文法の異常が見られることが多い。このことは、小脳内に統合されている行動の表象が文法としての機能を果たしている可能性を強く示唆している。

また、大脳皮質の失語に失行症が併発することもある。失行症とは、自分の行動についての表象が障害される疾患だが、この結果も行動の表象と言語が強く連合していることを示している。このように、原始的な言語に見られる普遍文法は、行動の手順についての表象と解釈できるように思う。

全ての条件が出会うところ

ここまで言語誕生に必要な条件として、１）ジェスチャーやまだ言語ではない発声を通して意図を共有しようとする新しいコミュニケーション能力の誕生（背景には、自己と社会の新しい表象能力の誕生）、２）複雑な作業記憶過程に単純な音節を連合させて記憶を固定する能力（背景にはexplicit memory形成能力）、３）行動の手順を表象し表現する能力（背景には統語能力）の３条件を見てきた。もちろん他にも条件を考えられると思うが、そろそろこれらの条件が集まって言語誕生へと向かう過程について考えてみよう。

それぞれの能力がいつ発生したのかはわからないが、言語の発生時期と考えられている１０−５万年前に急に現れた能力ではないと思う。おそらく、２足歩行のサルと言えるオーストラロピテクスから、人類として地上生活を始めたH.Ergasserが現れ、類人猿とは全く異なる社会生活が始まった頃から、人類はそれぞれの性質を備え始めていたと考えられる。実際この後、オスとメスの大きさの差がなくなり、噛みつくときに使う犬歯が退化する。すなわち、ボスが支配する集団から、争いの少ない平等社会に移行し、嚙みつく代わりに道具を使って骨を砕き、獲物を獲る狩猟生活に移ったと考えられる。しかし、もし多くの学者が信じているように、私たちホモサピエンスと数万年前まで交流があったネアンデルタール人や、デニソーワ人が言語を持たなかったとすると、条件は揃っていても、言語誕生のないまま２００万年近い狩猟生活が続いたことになる。そして、１０万年前になぜホモサピエンスがこれらの条件を現在の形の言語へと集約させることができたのか、またそのきっかけは何なのか、言語学の最も重要な問題になった。

異論もあると思うが（ネアンデルタール人も言語を持っていたと考える研究者は少ないが存在する）、条件が集まるきっかけを得ることができなかったネアンデルタール人は言語を手に入れることなく滅びてしまった。一方、我々ホモサピエンスのみが言語を手に入れることができ、地球の隅々にまで広がり支配者として君臨することになった。

ニュルンベルグのマイスタージンガー

実際きっかけについては、様々な説がすでに提案されているので成書を当たって欲しいと思う。この稿で紹介したい私の勝手な妄想は、道具（精巧な石器）作りを教える過程でこれらの条件が揃ったというものだ。そしてこのきっかけに、音楽の脳、道具の脳、そしてコミュニケーションの脳が出会いを媒介したのではないかという考えだ。これからそれについて説明するが、この可能性を考えている時、私の頭にフッと浮かんだのがニュルンベルグのマイスタージンガー第二幕のシーンだ。

オペラファンに説明する必要はないが、馴染みのない方のためにニュールンベルグのマイスタージンガー第２幕を少し説明しておこう。このオペラは、ニュルンベルグの古いマイスター社会に飛び込んできた新しい思想を持った騎士Walter von Stolzing（ワーグナー自身のことでもある）が、ニュルンベルグのマイスターからその芸術の重要性を認められるまでの「てんやわんや」を描いたオペラだ(こんな紹介は顰蹙ものかもしれないがお許しいただきたい)。孤立無援の騎士の持つ新しい芸術の可能性を最初から認め、支援するのが靴作りのマイスターHans Sachsだ。２幕ではSachsを中心に様々な場面が展開する。特に私の印象に残るのが、Walterを慕うEvaの悩みを聞いた後、Walterを貶めようと躍起になるベックメッサーが登場する前に靴を打ちながら歌うアリアだ（図2）。

図2：靴屋のマイスターハンスザックス。ニュルンベルグのマイスタージンガーの主役は騎士ウォルターではなく、間違いなくザックスだ。

ではどうして、この場面が言語誕生を想起させるのか？

もともと、オペラ、ニュルンベルグのマイスタージンガーは、様々な職人が歌を教養として身につけているという前提で成立している話だ。すなわち道具と音楽が一体化していることになる。道具と音楽が一体化していると考えても何も不思議ではない。道具を作ったり、使ったりする時はリズミックな音が出ることが多い。また、そのようなリズミックな音が、仲間同士の感情の共有に役に立っているのは、現在でも原始的な村落では見られることだ。

そして、なんといっても狩猟生活を送る人類の先祖にとって、道具作りは最も重要で、explicit memoryが要求される作業だったと思われる。さらに、それを他人に教えるとなると、explicit memoryだけでなく意図と目的の共有、利他性などそれまで人類が発展させてきた人類特有の能力が必要になる。このように道具作りは、言語誕生に必要な条件が全て揃う一つの状況になることは間違いない。

一方、音楽は現在も感情を伝え、共有するためには最も有効な手段だ。言葉を話す前の赤ちゃんは、感情のこもった発生とジェスチャーを使ってなんとか意思を伝えようとする。前出のスティーヴン・ミズン（Steven Mithen）は『Singing Neanderthal』の中で、言語が生まれるまで人類は音楽に近い発声をコミュニケーションに使っていたと考えている。この音楽の力は、例えばダビンチのモナリザを思い起こすときと、ベートーベンの運命の冒頭を思い起こす時を比べてみるとわかる。明らかに、音楽の方が思い出しやすい。これは音楽が感情と直に連合しており、 視覚表象より単純で、 脳回路の構造とフィットしているからだろう。

こう考えると、道具作りを教える時、ジェスチャーと共に、メッセージを伝えやすい音楽的発声が指示に使われたと思える。さらに、道具を作ること自体が音を発する。すなわち、explicit memoryを形成する時、連合させる単純な音が満ち満ちているのが道具作りの過程だ。当然、同じ音を、教える側、教えられる側が特定の事物の表象と連合させることができる確率は他の場合より高いと考えられる。その上、音楽を通じてより強く意図を共有する体制もできている。

言語誕生には、それまでexplicit memoryの形成のために各個体が個別に行っていた音節との連合を、偶然にしかし高い確率で他の個体と共有できる状況が必要になる。これが道具作りを教える状況に備わっていることは、以上の議論からわかっていただいただろうか。

こうして生まれた語彙が広まるのが簡単なことは、例えば有名なニカラグアの聾唖の子供達に自然発生した手話の例を見ればわかる。聾唖であることから言語世界から完全に切り離されて育った子供たちが集められて、200-400人規模で集団生活を始めることで、急速に彼らの間で通用する独自の手話が発達した。これは、一旦語彙が共有されると、それを教え合って、集団全体で共有することが可能なこと、語彙を共有する方法が確立すると、個々のコミュニケーションの現場で取り決められる語彙や文法は、瞬く間に集団で共有されることがニカラグアの手話の例から明らかになっている。このように言語は、集団で共有されることで、個人の脳内過程から解放され、集団に支えられ独自に進化することができる。要するに、１−２個の語彙の意味を共有することができれば、あとは自然に現在の形へと発展したのだろう。

なんとか言語誕生の大枠について書くことが できたので、次回からはこの大枠に基づいて 各部分の詳細を詰めていこうと思っている。

[ 西川伸一 ]

進化研究を覗く最新号へ