1. トップ
  2. 語り合う
  3. マイスタージンガーモデルに関する補足I

進化研究を覗く

顧問の西川伸一を中心に館員が、今進化研究がどのようにおこなわれているかを紹介していきます。進化研究とは何をすることなのか? 歴史的背景も含めお話しします。

バックナンバー

マイスタージンガーモデルに関する補足I

2018年2月15日

2回に分けて言語誕生についての私の考えを読んでいただいたので、私が言語誕生についてどう考えているのか、マイスタージンガーモデルから理解していただけたのではないだろうか。しかし細部の詳しい説明は抜けているし、結局「なんとでも言える」Just So Storyと思われてしまいそうだ。そこで今回から、このシナリオの説得力を高める為、幾つかの細部について補足したいと思っている。

このモデルでは、話し言葉中心の言語が発生する前から言語の基本能力は進化しており、サルとは異なる人類独特のコミュニケーションが可能になっていたと考えている。この点についてまず補足する。

いま現在私たちが使っている言語は、音をベースにした話し言葉と、文字をベースにした書き言葉からなっているが、文字が出来る前は話し言葉が中心だった。マイスタージンガーモデルでは話し言葉を中心とした言語が5万年前後に急速に発達したと考えており、この点についてはさらに補足する予定だが、もちろんそれ以前にもコミュニケーションのための方法は存在していた。例えばジェスチャーもそうだし、以前紹介したスティーヴン・ミズン(Steven Mithen)の言う音楽的抑揚のあるHolistic言語(http://www.brh.co.jp/communication/shinka/2017/post_000014.html)もその一つと言える。

言語の本質を考える時、話し言葉が成立する条件だけに限定すると、言語誕生に最も重要な条件を見失うことになる。この重要な条件とは、人類のみが獲得した能力で、具体的には、経験を明瞭に記憶し、記憶から呼び出した表象を、実際の対象が存在しない時に相手に伝える能力だ。


図1 シカ狩りを例に言語の条件を考える(説明は文中)

例として、複数の個体が協力して狩りをする状況を考えてみよう(図1)。何人かで狩りに出かけ獲物を探している時、目の前に鹿が現れたとしよう(設定1)。眼前の鹿の存在を皆で共有することはたやすいし、鹿を獲物にしようと全員が目的を共有することは人類でなくともたやすいだろう。人間なら、ポインティングやジェスチャーなどで標的を共有する動作が出ると思うが、ライオンのように複数で狩りをしてもほとんど個体間のコミュニケーションのない動物でも、目の前の獲物に共同して本能的に飛びかかることはできる。またその時、それぞれの頭の中に、鹿のイメージ、匂い、声などが表象され記憶されるだろう。脳科学的に言えば、このようにして生まれる鹿の表象はどの個体でも同じような脳の領域を用いて記憶されていると思う。

何回かの狩りの経験を重ねた個体では、脳に鹿の表象の記憶がだいたい同じように成立していると考えて話を進める(図中で記憶と示している)。もちろん、以前に紹介したように、人間と他の動物では前頭前皮質連合野の発達の違いでexplicit memory(鮮明な記憶:顕在記憶と邦訳されている)の程度が質的に異なっていると考えられる。しかし、ライオンでもサルでも、匂いがすれば鹿、あるいは獲物の表象を何らかの形で呼びおこしていることは間違いない。すなわち、鹿=獲物についての視覚的表象と、音や匂いの表象が連合して記憶され、新たに音や匂いの表象を体験した時、目の前に鹿がいなくても鹿の表象に結びつけることが出来る。このように鮮明度はともかく、各個体が匂いや音といった刺激により、獲物を表象する神経過程は動物から人間まで共通に備わっている。

次にこのような記憶が成立した個体が集まって獲物を探している状況を考えよう(設定2)。この時、一人、あるいは一頭の個体が匂いを通して真っ先に獲物の気配に気づくことはあり得る。獲物はまだ見えないのに、気配に気づいたとすると、そのことを伝える必要がある。でないと獲物は逃げてしまう。この時人類なら、頭の上に指を突き出して、鹿の形態を真似て鹿が潜んでいることを伝えることができる。ほとんどコミュニケーションの手段を持たないライオンは別にしても、例えば人類に近いチンパンジーの狩りのビデオを見ると(https://www.reddit.com/r/videos/comments/6wqocb/chimpanzees_hunting_monkeys_is_both_amazing_and/)、樹上のオナガザルに気づいた個体が立ち止まって木を見上げると、他のサルも止まって見上げていることから、獲物がいることを態度で示していることがわかる。このビデオではその後、一匹のオスが獲物に近づいて木の上のサルを追いかけ、逃げ惑うサルを待ち伏せしていた他のサルが仕留める様子を映している。すなわち、気配に気づいたことが習性に従って自然に態度に表れ、その態度を感知した他の個体が、学習したパターンに従って協力して狩りを行っている。このビデオでは、ジェスチャーやポインティングは全く見られない。

もちろん人間でも場合によっては、同じように決まったパターンで行動することもあるだろう。しかし、必要ならジェスチャーやポインティングを使って自分が獲物に気づいたことを伝えることができる。一方、サルは両方の手を使うことができるものの、ジェスチャーで獲物の形態模写を行うことはおそらく未だかって観察されたことはないと思う(確かめたわけではない)。

この過程をもう一度整理してみると、

  1. 1)鹿の視覚的表象と、匂いや音の表象を連合し、記憶する(人類・動物共通)
  2. 2)匂いや音の表象から、鹿の視覚的表象を呼び起こす(人類・動物共通:表象の鮮明度は人類がすぐれている?)。
  3. 3)鹿の視覚的表象を、ジェスチャーで形態模写し、それを他の個体も理解する(人類特有)。

という一連の過程が起こっている。とすると、最後の形態模写ができる点が人類のみに備わった言語誕生の条件になる。すなわち、臭いという指標で活性化された視覚イメージが視覚野を興奮させるところまでは他の動物も同じだが、その表象を形態模写しようという着想と、実際に表象に基づいて形態模写する行動は人間特有になる。もちろん、表現にジェスチャーを用いる必要はない。コミュニケーションという目的なら、鹿の声を真似てもいいし、今匂いを感じていることを、鼻を広げて表現してもいい。要するに、頭の中に呼び出した表象が、他の個体の脳にも誘導することがポイントになる。チンパンジーを見ていると、狩りの時両手が使えると言っても、実際にジェスチャーで何かを表現することは解剖学的に難しいと思う。また、鹿の声を真似ること同じ理由で難しい。このように、新しいコミュニケーション手段が発達した背景には、もちろんこのような解剖学的な差も存在する。

この時、ツノを突き出す形態模写は実際の鹿のイメージに近く、セッティングにもよるが表象(意味)を他の個体と共有できる可能性は高い。パース流に言えば(http://www.brh.co.jp/communication/shinka/2016/post_000012.html)、イコンを用いる表現によるコミュニケーションになる。

一方、鹿の声を真似て表現するのは、鹿そのものを表現しているわけではないが、声が鹿の存在を示し、また鹿の表象を他の個体の脳に呼び起こす指標になると言える。これは、パースの言うインデックスと言えるが、話し言葉のルーツと言えるのかもしれない。

鼻をクンクンさせて、今匂いがしていることを伝え、他の個体も同じ匂いを嗅いでみて確かに鹿だと確認することもできる。この場合は鹿の匂いというインデックスを共有したいことを、「嗅いでみろ」と形態模写で伝えることで、最終的に同じインデックスを相手にも嗅がせて、鹿の表象を他の個体の脳内に形成させることになる。このように、コミュニケーションの手段は言葉がなくとも多様に存在するが、いずれの方法でも、最終的に自分の頭の中に呼び起こした鹿の表象を、他の人の頭の中に呼び起すことがゴールになる。

ではこの過程を支える人間特有の能力とはなんだろう。

すでにゴールを他の人間と共有して協力関係を樹立できるのは人間特有の能力であることを述べたが、獲物の表象を共有する過程を考えてみると、言語の背景にも同じ能力、すなわち

  1. 1)ゴールを共有する協力を可能にする人間特有の能力、
  2. 2)explicit memoryの形成能力、

が存在することがわかる。この能力の脳科学的背景として、ホモ・エルガステル(Homo.Ergasser)の誕生から始まる、前頭前皮質の連合野の急速な発達があることは間違いない。重要なことは、これらは全て学習により発生するのではなく、自然に発生する能力である点だ。explicit memoryが脳の様々な領域を連合させる前頭前皮質の発達に強く依存していることはわかるが、ゴールを他の個体と共有して協力する能力が、連合野がどの領域と結合することによるのかを特定することは現段階では難しい。

さらに言語は進化し、最終的に話し言葉(音節)をシンボルとする段階に至るが、全て上に述べた最初の言語へ向けた脳内のネットワークに起こった質的ジャンプの延長として考えることができる。鹿を求める狩りを例に、さらに進んだ内容のコミュニケーションを考えてみよう。

例えば昨日鹿を見た場所に今日も行ってみようと相談をするという設定が考えられる(設定3)。この時、実際の鹿が近くにいて気配を感じているわけではない。従って、具体的な鹿の存在にまつわるイコンやインデックスは存在しない。すなわち、この時鹿について語るためにジェスチャーや鳴き声を真似ることは、狩りをするという目的が共有されている必要がある。そしてこの場合、この目的が記憶から鹿の表象を呼び起こす刺激として働き、目的を共有する他の個体にも同じ刺激として働いている。すなわち、存在しないものを表現できている点で、我々の言語に極めて近いレベルに達している。そしてこのためには、レベルの高いexplicit memoryと目的の共有が必要で、これは人間だけが達成した能力だ。残念ながら、何か新しい分子の進化に基づく質的変化かどうかは明らかではない。

このように実際には存在しない表象を共有するための記憶が成立し、目的のような抽象的な表象が共有できる段階に達すると、ジェスチャーや鳴き声といったインデックスにより呼び起こされる表象はすでに脳内の様々な表象と連合している。例えば、狩りのプランに実際に必要なのは、肉にありつくため獲物を得ることで、目的はジェスチャーで表現した鹿の表象に限らない。以前紹介したように(http://www.brh.co.jp/communication/shinka/2017/post_000022.html)、私たちの脳内の表象は決して単独で存在するのではなく、様々な表象とカテゴリー化して連合している。鹿の表象は獲物になるほとんどの動物と連合しているだろうし、また獲物以外の危険な動物など多くの記憶とも連合している。実際、狩りで最初にイノシシに出会っても、プラン通りアタックすることになるだろう。

以上をまとめると、言語能力の条件として、

  1. 1)情報を共有したいという強い欲求、
  2. 2)レベルの高いexplicit memory(高い表象間の連合能力)
  3. 3)実物に依存しない表象の呼び起こし
  4. 4)これらをストーリーに仕上げる統語能力に必要な、身体的行動の表象能力

があり、これが揃えば話し言葉も目の前だと考えている。

確かに、最後のセッティングでは目的と言った抽象的なきっかけで異なる個体が同じ表象を共有するなど、かなり高度に見えるが、条件自体は話し言葉を持たない直立原人や、ネアンデルタール人も持っていても何の不思議はないと思っている。しかし、コミュニケーションの為のボキャブラリーを増やすには、音節をシンボルに使う、話し言葉の誕生が必須だった。

これが起こったのを、マイスタージンガーモデルでは5万年前と推定しているので、次回は、我々ホモ・サピエンスの歴史を見ながら、5万年前に現在のような話し言葉が始まったと考える根拠について補足する。

[ 西川 伸一 ]

進化研究を覗く最新号へ