1. トップ
  2. 季刊「生命誌」
  3. 季刊「生命誌」102号
  4. RESEARCH サルの発声から見るヒトの言語の起源
RESEARCH & PERSPECTIVE サルの中のヒト・言語をもった人間
RESEARCH 1

サルの発声から見るヒトの言語の起源

香田啓貴

京都大学霊長類研究所

言葉で意思を交わすヒト特有の能力は、どのような進化過程を経て生まれたのでしょう。同じ霊長類であるサルは、感情豊かな表情や鳴き声でコミュニケーションしていますが、言葉は話しません。
化石には残らない「声を使って話す(発話)」という能力の進化過程を知る手がかりは、どこに隠されているのか。サルの行動から探った研究を紹介します。

1.ヒトの「言語」はどのようにして獲得されたのだろう

ヒトの特徴の一つに「言語」をつかう能力がある。言語能力とは何か?ヒト固有の思考過程あるいは脳の演算能力がその基本にあることは間違いないが、簡潔な定義はまだ得られていない。言語のような化石に残らない行動の進化過程を探るには、同じ霊長類であるサルと比較する方法が有効だろう。たとえば、ヒトであれば発達早期に学習する「話す」能力がサルにはない。言葉を「話す」こと即ち「発話」とは、ヒトが言語を使用する際に用いる感覚運動能力であり、言語を支える一つの能力と考えることができ、こうした能力の積み重ねの上で言語は成立したであろうと考えられる。

サルは訓練を重ねても任意の合図に応じて声を出すことが難しい。半世紀ほど前に、類人猿を人の子供と同じように発話を引き出す訓練を通じて言語習得の過程を捉えようとした試みはすべて失敗に終わっている。大道芸として伝わる猿回しのなかで、手を上げて返事をするサルに覚えはあっても、声で返事をするサルは誰も見たことがないだろう。これらは、ヒトの発話とサルの発声の違いを明瞭に伝える経験的事実といえる。サルが発声の学習ができないのは、発声運動に関する神経基盤と多彩な音を生み出す音響器官としての身体基盤が、ヒトとは決定的に異なるためだ。言語成立に先駆けた「発話」は、ヒトへの進化過程でいつどのように出現したのだろうか。ヒトの発話にあって、サルの発声にはないものや、発声には関わらないが発話と共通する現象の理解を通して、ヒトの発話がどのように生じたかを考えてみたい。

2.喉と手指の操作

20年ほど前に心理学者マイケル・コーバリスは、発声運動に先立ち手の運動操作の能力が拡大し、「発話」運動がやがて言語に至るという仮説「From hand to mouth(手から口への進化)」を発表した 。私と研究仲間は、この進化仮説の間接的証拠を得るためニホンザルに運動操作学習の訓練を行い、その機序に発話進化の手掛かりを発見しようと考えた。発声動作と手の動作の本質的違いを調べるためだ。モニター画面が赤く点灯してから5秒以内に一方は「発声」、もう一方は手を使った「タッチ」するグループに分けて訓練する(図1)。「発声」を訓練するサルは、訓練習得に歴然たる差があった。実験室で鳴くまでに半年程度かかり、達成基準(8割以上の発声成功率)に至るには1年程度かかった。一方「タッチ」は、わずか3日程度で全てのサルが基準に到達した。

(図1)ニホンザルの運動操作学習訓練

一方のサルには赤い画面が現れると「発声」をする訓練を行い、もう一方のサルには「タッチ」を行うように訓練する。正解すると餌がもらえる。

それぞれのサルが動作を習得した後に、次の実験を実施した。訓練では次の合図まで20~30秒程度時間を空けていたが、実験では時折、5秒とか2.5秒とか突然に合図を出すというものだ。突然の変化にどのように対応するだろうか?「タッチ」を訓練したサルは、こうした突然の合図にたいして何事もなくいつも通り画面を触る。しかし、「発声」を訓練したサルは、こうした突然の合図に声が出ない。口を開き、声を出したいようにも見えるが結局5秒たっても声は出ない(図2A)。なんとか成功(5秒以内に発声できた)した場合でも「タッチ」に比べて反応時間は遅れてしまう(図2B)。このように、1年もかけて訓練した発声動作は、極めて柔軟性に乏しいものであることがわかった。ここからサルは手を動かすようには随意に口を動かすことができないといえよう。私は、訓練したサルの発声動作は手の動作とは根本的に異なる機序で成立したものだと考えている。一方で、ヒトはまるで手足と同じように喉を自由にあやつれる神経基盤を獲得したと言えるわけだ。

(図2)ニホンザルの運動操作学習実験

A)4匹のサルの実験結果。訓練時(ピンクのグラフ)とは異なり、突然合図を出すと「発声」は失敗する(赤矢印)。「タッチ」に影響は出ない。

B)実験成功時の反応時間。「発声(青)」での反応は「タッチ(緑)」に比べ反応が遅れる。合図の間隔が短くなるにつれ、その差は顕著になる。

3.サルの「発声」とヒトの「発話」

「発話」の特徴は多彩な音である。その音色の基盤は、喉の形に由来する。たとえば日本語の場合、「あ」「い」「う」「え」「お」など多様な母音が確認でき、それらを生み出す喉の形がある。一方で、サルはこうした母音は生み出せない。喉の形状に違いがあることがその根拠の一つである。ヒトとサルの喉の形状の決定的な違いは、発声の際に音を発する喉頭の位置がサルと比べヒトでは低いことだ(図3)。ヒトでは喉頭の位置が十分に低いことによって、喉に大きな空間をつくり、多様な共鳴を生み出す基盤となっている。多彩な音を支える身体のつくりの違いは「発話」を支える重要な要素の一つなのだ。

「発話」のためには、素早く複雑に音を生み出す喉の「かたち」を“随意的に(思い通りに)”動作させる必要がある。発声の随意性は、脳の運動野から喉頭を動作させる運動神経核への配線に依存すると考えられている(図4)。ヒトには、この運動野から運動神経核への直接経路が存在するが、サルには直接経路がなく(だから、声を自由に操れない)、呼吸などを司る網様体などを経由する。この「直接配線」と「かたち」の成立と統合が、ヒトの”随意的な発声“を可能にしたのだと考えられる。

(図3)サルとヒトの“身体基盤”の違い

発声に関わる基本的な器官は相同である。ヒトの喉頭はサルと比べて低い位置に配置されている。これにより多彩な音を生み出す「かたち」が成立した。

(図4)サルとヒトの“神経基盤”の違い

ヒトは運動野から運動神経核への直接経路を獲得したことで、「発声」運動を手指のように自由に操ることが可能になった。

4.「発話」と無関係に生じた共通の口の動き

さらに、「発話」の本質は随意性のみでない。唇の素早い開閉運動も一つの要素だ。興味深いことに、ヒトの発話は5〜6Hz(1秒間に5〜6回)で口が開閉する。この動作の進化的起源について「サルのリップスマッキングという表情から進化した」という奇妙な仮説がある。サルの「リップスマッキング(LS)」は優位な個体が劣位の個体に向かい、唇を突き出し、「パクパク」素早く動かす表情動作である。この周期が5〜6Hzであり、発話の起源であるというのだ。一見信じがたいが、実際にX線カメラで調べると、LSは舌骨など内部筋骨格器官も周期的に動いており、ヒトの発話時の舌骨の動きと酷似する。発達面を見ても、ヒトの乳児が「バブバブ」というゆっくりとした喃語から素早い発話に成長するように、LSは1歳児においてはゆっくりで、2Hz程度だが、発達に伴い素早く安定化し、ヒトの発達と類似する。さらに、LSに使用する表情筋もヒトの発話運動の表情動作と一致し、咀嚼などとは異なるなど、あらゆる証拠が発話動作とLS動作の「相同性」を支持するのだ。私は当時霊長類研究所の大学院生だった豊田有君とともに、タイに生息するベニガオザルの特殊な表情を分析したことがある。このサルはLSをしない。しかし交尾時にオスが口を大きく横に開き高速に歯軋りを繰り返すような固有の表情動作(「ティースチャタリング(TC)」)が気になった(図5:動画)。もしも「動作の周期を生み出す何か」が獲得されているのであれば、種や動作様式が異なっても、動作の周期は同じ5〜6Hzと観察されるのではないかと予想したのだ。周期を調べてみると、見事に1秒間に5回カチカチと動かしていたのだ。すなわち、発話運動やLS、TCなど動作様式は異なれど、「動作周期を生み出す原理」は、ヒトとサルの共通祖先で獲得され、それが現生のヒトや様々なサルに引き継がれているという説に結びつく。

(図5:動画)ヒトやサルで多様化した表情動作:ティースチャタリング(TC)

ベニガオザル で見られる交尾の際のオスの歯ぎしり。1秒間に5回、口を開閉している。

5.能力の相互作用

「発話」について、いくつかの「要素」の進化を述べた。一つは、喉の形状の変化によって多彩な音の生成が可能となったこと。次に発声を自由に操作する“運動随意性”の獲得である。もう一つは、発話に関する表情運動について。サルの発声動作と直接関係のない表情動作に、ヒトの「発話」との共通性が数多く観測された点だ。素朴に考えると、「発話」能力はサルの未熟な発声が洗練された結果だと考えやすい。しかし、そうではない。大切なのは、これまでにあげた複数の要素群の『統合』と言う視点であることを強調する(図6)。それぞれの要素が「発話」という特別な能力に向かって一方向的に進化したのではない。さまざまな要素が形を変えながら受けつがれ、偶然にもヒトでその要素群が相互作用し統合された結果、創発したのが「発話」だと考えるのが正しい進化史の視点であろう。

(図6)「発話」は個々の要素の『統合』の結果、創発した。

6.言語能力も能力統合の産物

「発話」能力の獲得と「言語」能力の獲得は、当然同義ではない。手話や書き言葉など、発話を伴わない言語がある一方で、声真似するオウムなどの動物は、「発話」能力に優れているが、「言語」能力を獲得したと考えないだろう。

「発話」は「言語」能力の獲得以前に成立した一種の運動能力である。しかも、「言語」能力には「発話」以外にも、他者の心を推論する能力など、さまざまな要素群が存在していると考えられている。我々ヒトのみが、物事を名付ける記号化や、それを組み合わせる演算能力を持つ。個別の要素は「言語」能力獲得のために出現したのではなく、個別の要素が進化し、再利用され、統合されるという現象を繰り返し、その過程で偶然に起きた要素の『統合』によって「言語」能力が出現したと捉える生物進化史が、日の目を見る時を確立しようと目論んでいる。

香田啓貴(こうだ・ひろき)

2001年京都大学理学部卒業。 2003年京都大学大学院理学研究科生物科学専攻修士課程終了。博士(理学)。京都大学霊長類研究所多様性保全研究分野助手を経て、2008年より同研究所認知科学研究部門助教。現在、文部科学省新学術領域「共創的コミュニケーションのための進化言語学」のメンバーとして言語成立の進化史についての妥当な仮説構築を、参画する仲間と共に取り組んでいる。

RESEARCH & PERSPECTIVE

サルの中のヒト・
言語をもった人間

 

オンライン開催 催しのご案内

レクチャー

2025/1/18(土)

『肉食動物の時間』