37.高次神経機構・学習

§1.学習とは
 ひとも含めた動物は生後新しい事態に直面すると、それ以後の行動が以前と異なった、新しい、しかもその事態に即したものに変化する。このように経験によって動物の行動が比較的長期にわたり変化する過程を学習 learning という。ここでいう経験とは決して精神過程を意味せず、動物の遭遇する環境(刺激群)とその下で生じる動物行動をひとまとめにしたものをさす。
 一方、学習によって引き起こされる行動変化は、経験の効果が何らかの形で生体内に蓄えられてたために生じると考えられる。この経験の効果の保持過程を記憶 memory という。保持過程は当然、脳を介して生ずるから、学習の脳内過程を広い意味で記憶と定義できよう。したがって学習と記憶は1つの過程を表と裏から見ているにすぎない。
 学習は新皮質が発達した動物に著しい。ヒトでは時に著しく、ヒトを他の動物から区別しているものであり人間性の証ということができる。

§2.学習の種類
 学習にはいろいろある。我々が社会的習慣を身につけるのも学習である。またイヌが飼い主を覚えるのも学習である。このように千差万別の学習という現象を整理して行くと、基本的に次の3種の学習に分類できる。
 〕松螻惱 redundancy learning :動物にとって不必要な情報を積極的に捨てる学習。
 ∀合学習 associative learning :2つの刺激が時間的に同時または近接して与えられたとき生じる学習である。
 7覯務惱 contingency learning :動物が行動した結果に基づいて生じる学習である。
 その他いろいろな学習が考えられているが、以下この3種の基本的学習過程について述べる。

§3.余剰学習 redundancy learning 
  学習の最初の過程は、動物がある環境(刺激群)に遭遇し、これを受容することから始まる。しかし、受容したすべての情報が脳内で処理され貯蔵されるわけではない。脳には、情報的に価値のあるものとないものを取捨選択する機構が存在する。このうち、慣れ habituation と呼ばれる現象は重要であり、一種の学習とみなすことができる。
 いま、動物に突然大きな音を聞かせると、動物は音源の方向に目と頭を向ける。同時に骨格筋の緊張がたかまり、脈拍も速くなる。動物のこれらの行動を指向(定位)反射 orienting reflex という。このとき大脳皮質脳波は、安静時にみられるα波が消失し、代わりに速波であるβ波が現れる(図7-13)。ところが同じ音をくりかえし動物に聞かせると、指向反射は次第に弱くなり、ついに消失する。この指向反射の消失過程を「慣れ」という。
 慣れにみられる反応の低下は、刺激をくりかえし与えたため、神経系の反応性が一般的に低下したために生じたのではない。反応の低下は与えられた刺激に特異的に生じる。いま、1秒間持続する500Hzの音を数分間隔でくりかえし動物に与えると、最初生じた指向反射が生じなくなる(図7-13b)。すなわち慣れが生じる。このとき100Hzの音を聞かせると、動物は再び強い指向反射を起こす(図7-13c)。このような刺激特異性はかなり鋭く、毎回あたえる刺激の種類、強度、持続時間が同じでなければ、慣れは生じない。したがって、慣れは到底神経系の「疲労」によって生じているとは考えられない。神経系が、特定の刺激に積極的に「反応しない」ことを学習した結果であると考えなければならない。いったん生じた慣れは数カ月から数年にわたって保持される。
  慣れ学習の成立には脳幹網様体が重要な役割を果たしている。これは、行動の慣れと、脳幹網様体に起因するといわれる脳波の覚醒反応の低下が平行して生じることからわかる。Sokolov (1960) は、網様体にさらに大脳皮質を加え、両者の関連によって慣れが発生する機序を次のように説明している。いま、1つの刺激が与えられたとき、大脳皮質の神経細胞はこの刺激によって活動し、その結果、刺激の種々な特徴を貯える。次にまた刺激が与えられると、この刺激と脳に貯えられている前の刺激パターンが比較される。両者のパターンが一致しない場合は、大脳皮質から網様体に興奮性の神経インパルスが送られ、網様体の活性が高まり、その結果指向反射が生じる。両者のパターンが一致すれば、皮質から網様体へ抑制インパルスが送られ、網様体の活動が低下し、その結果、慣れが生じる。
<図38−1>

§4.連合学習 associative learning
 前項では、情報的価値のない刺激が捨てられる機序について述べた。それと反対に刺激に情報的価値が付加される場合がある。1つの刺激が情報的に価値のある第2の刺激と同時か、近接して動物に与えられるとき、第1の刺激の情報的価値が増す。第1の刺激の情報的価値増大は、第2刺激と”連合”して与えた結果生じると考えられるから、この種の学習は連合学習と呼ばれている。この中で典型的な例は、パブロフ Pavlov の古典的条件反射 classical conditioned reflex である。
 その1例をあげる(図7-14)。イヌに音刺激を与える。このとき指向反射が生じる。音刺激を繰り返し与えると慣れが生じ、指向反射が生じなくなる。このように、動物に反応を起こさなくなった刺激を中性刺激 neutral stimulus という。この中性刺激と同時または少し遅れて食餌刺激を与える。食餌刺激には必ず唾液分泌という反応が続く。唾液分泌は生得的な反応であるので、無条件反応 unconditioned response (UCR) と呼ぶ。また、食餌刺激は無条件反応を誘発させる刺激であるから無条件刺激 unconditioned stimulus (UCS) という。さて、中性刺激と無条件刺激を組み合わせてくりかえし動物に与える。次に中性刺激であった音のみを動物に与えると、UCSがないにもかかわらず唾液分泌が生じる。この反応を一般に条件反応 conditioned response (CR) という。またこの時、音はもはや中性刺激ではなく、条件反応を引き起こす刺激であるので、条件刺激 conditioned stimulus (CS) と呼ぶ。このことを模式的に示せば、
   音刺激 (CS)   →   ある反応
  食餌刺激(UCS) →   唾液分泌(UCR)
となる。即ち、CSとUCSの組み合せ刺激を動物にくりかえし与えた結果、点線のような「連合」が生じたとみるのである。
 条件反射が成立したときCSによって引き起こされる反応(CR)は、一般にUCRそのものではない。それはUCRの一部か、次に生じるであろうUCSに対する準備反応とみなされる。このことを唾液条件反射を例にとって説明する。UCRは唾液分泌、咀しゃく、嚥下、尾振り等である。しかしCRはこれら反応の一部しか含まない。一方CRは食餌に対する定位反応を含む。これはUCRには見られない。
 条件反射が成立したとき、用いたCRと類似の刺激(たとえば条件刺激が音ならば異なった強さ、調子の音)に対してもCRが生じることがある、この現象を汎化 generalization という。反対にCRが特定のCSのみで生じ、その類似刺激では生じないとき、条件反射は分化 differentiation したという。

<図38−2>

 連合学習が成立するにはCSとUCSを呈示する時間関係が重要である。もしもUCS-CSの順序で呈示すると連合学習はほとんど生じない。CSを先ず呈示し、約0.5秒後にUCSをあたえると、もっとも連合学習が成立しやすい。CS-UCS間の間隔をさらにあけると、学習の成立はだんだん困難となる。
 成立した連合学習は数年にわたって保持されるという。しかし、CSのみをUCSなしで単独にくりかえし動物に与えると、条件反応は次第に生じなくなる。この現象を消去 extinction という。消去は連合学習の完全な消失(忘却)を意味しない。CRが積極的に抑制された状態であると考えられる。このことはCRが消去操作によって消去された後、一定期間(たとえば翌日)を経てCSのみを呈示すると、CRが再び生じることからわかる。この現象を自発性回復 spontaneous recovery という。

§5.連合学習の成立機構
 パブロフ Pavlov は、連合学習は大脳皮質内で生じると主張した。しかし、近年の研究によって、皮質を外科的に完全に除去した動物にも、連合学習が成立するといわれ、連合学習は、基本的には皮質下で生じると考えられている。また、間脳や中脳を破壊すると連合学習が消失することから、これらの部位が連合学習成立に重要な役割を果たしていることがわかった。また、連合学習が成立していく過程で電気活動(脳波)の最も顕著な変化が脳幹網様体で見られることから、中性刺激と無条件反応の連合は、ここで生じると考える人もいる。しかし、複雑な刺激パターンの分化には、もちろん大脳皮質も必要と思われる。
 
<図38−3>

§6.結果学習 contingency learning
 結果学習は、動物がある行動を行った結果に基づいて生じる学習である。いま、動物がある環境下に1つの行動をした結果、報酬 reward を得た場合を考える。動物はこの報酬を刺激として受容する結果、再び同じ環境に置かれると、報酬を得るために前にしたのと同じ行動をするようになる。また行動の結果、報酬でなく罰 punishment を受けると、動物はその後罰から逃れようとする(あるいは罰の効果を弱める)行動をするようになる。報酬または罰は、行動を強めるという意味で強化刺激 reinforcing stimulus、または強化因子 reinforcer と呼ばれる。
 結果学習の代表的なものに、オペラント条件付け operant conditioning がある。そこで例をあげる(図7-15)。絶食させ、飢餓状態にした動物を実験箱にいれる(図7-15上図)。箱の中にはテコがとりつけられており、そのテコを押せば餌が餌皿に放出するようになっている。動物は箱の中で種々な行動(探索行動等)を行う。そのうち、偶然テコに触れ、それを押す。その結果、装置が作動し、餌が放出され動物は餌を得る。この後、動物はテコ押しを行って餌を得ることを急速に学習する。すなわちテコ押しの頻度が増大する。このようなオペラント条件付けは、ある時は水を飲ませないで、のどの渇いたサルを椅子に座らせて、前にあるテコを押させて行うこともある(図7-15下図)。この時、動物は〈実験箱〉という環境において〈テコ押し〉という行動を行った結果、餌という報酬を得て、同じ行動を行うようになるのである。ここで報酬は行動を強めるという意味で強化因子と呼ばれる。このことを模式的に示せば、
   環境 → 行動 → 強化刺激
となる。また、ある行動に対して報酬を与えるのではなく、動物にとって不快な刺激(罰)を与えると、動物は、不快な刺激からのがれる(あるいはその効果を弱める)行動をするようになる。したがって、罰も強化因子である。
 結果学習の成立には、強化の与え方が重要である。一般に、強化を与えた直前の行動が特異的に強化される。いったん強化された行動も、その行動が生じたとき強化しなければ、やがて生じなくなる(オペラント消去: operant extinction )。また、成立した行動は、行動が起こるたびに全部強化しなくとも、間欠的に一部の行動のみ強化されれば、消去せず持続する(間欠強化: intermittent reinforcement )。
 結果学習において、もう1つの重要な条件は、強化される行動が生じる環境である。上の例では、動物は実験箱という特定の環境内でのみテコ押しを行い、強化を受ける。このとき、実験箱内の環境(すなわち刺激群)が行動発現〈きっかけ〉となっており、異なった環境下ではテコ押し行動は生じない。このように、行動を引き起こすきっかけとなる刺激(群)を手がかりという。すなわち、結果学習の一般的な手続きを模式的に示せば、
  手がかり刺激 → 行動 → 強化刺激
と書ける。特定の手がかり(たとえば、特定の色や図形など)のもとで生じた行動だけを強化すると、その行動は、その手がかりがある時だけ起こるようになる。この現象を刺激弁別 stimulus discrimination という。
 図7-15の下に示したのは、小さな光スポット(a)がついた時にサルがテコ(b)を押すと、ジュースが得られる(強化される)という刺激弁別の1例である。

§7.結果学習の脳内機構
 結果学習は連合学習と異なり、学習成立の過程に大脳皮質の存在が必須であると言われている。このことは、大脳皮質を摘除するか、あるいはその機能を拡延性抑圧 spreading depression によって一時的に消失させると、結果学習が成立しなくなることから主張されている。
 結果学習に対応する記憶は、一側の大脳半球に限局することができる。このことは、大脳半球間の繊維連絡を切断することによって確かめることができる。視神経交叉の中央部を矢状面に沿って切断し、各眼からの視覚情報がその眼と同側の大脳半球にのみ達するようにする(図7-16)。さらに脳梁を切断し、両大脳皮質間の連絡を絶つ。このような処置を施した脳を両断脳 split brain という。両断脳において、一眼のみ用いて(反対側眼は覆っておいて)図形弁別学習を行う。すると弁別学習が成立する。ところが覆っておいた眼だけに図形を見せ弁別行動を調べると、学習効果は零であった。このことは、弁別行動に対応する記憶が、図形を見せ眼とと同側の大脳半球のみに限局して存在することを示す。他側の大脳半球にはその記憶はない。
 視神経にのみ上記の分断手術を施し、脳梁は正常な動物においては、一眼のみを用いて弁別行動を成立させれば、その弁別行動は他眼に対しても成立する。このことは、一側半球にできた記憶痕跡が脳梁繊維を介して他側の半球に転移 transfer し、記憶痕跡は両側半球に重複して存在すると考えられる。
 このように、結果学習に対応する記憶痕跡が大脳皮質間を結ぶ脳梁を切断したときに、一側の大脳半球に限局することからも、結果学習は大脳皮質機能と密接に関係をもっていることがわかる。

<図38−4>
§8.記憶の固定化
 学習の結果生じる動物行動の変化に対応して、中枢神経系内に生じるであろう変化を漠然と記憶ということは前に述べた。このような記憶は再生 reproduction 可能な時間をもとに、さらに2つに分けられている。短期記憶 short-term memory とは、短い期間内(分の単位)だけ再生可能なものをいい、長期記憶 long-term memory とは、さらに長い期間再生可能なものをいう。電話帳を見て、すぐ番号を暗唱するのは前者の例、幼児期の経験を覚えているのは後者の例である。
 このように記憶に2つの状態があることは、ネズミの回避学習成立が頭部の電気痙攣ショック electroconvulsive shock (ECS) によって障害される実験から推論された(Duncan, 1944)。ネズミを2つに仕切った箱の一方に置く。この仕切りから他方の仕切内に10秒以内に移動しない場合、足に電撃を与えた。ネズミ箱の電撃から逃れるため、他方の仕切り内に移動する。この回避学習は1日1試行、18日間続けられた。ネズミは数回の試行でこの回避学習を覚え、一方の仕切りにいれると足に電撃が来る前に速やかに他方の仕切りに逃げて電撃を回避するようになる。
 ネズミが電撃を受けて、他の仕切り内に逃避した後、同等部にECSを与え、てんかんを起こす。この方法によりてんかんの回避学習過程に対する影響が調べられた(図7-17)。移動してからECSを与えるまでの時間間隔は、ネズミによって20秒から14時間までに変えた。移動終了後20秒にECSを与えたネズミは、18試行後も回避学習は成立せず、ほとんど毎試行足に電撃を受けて初めて、他の仕切りに逃避した。移動後に与えるECSの時期を遅らせると学習は次第に成立するようになる。1時間以上遅れて与えられたECSは、回避学習成立にまったく影響を与えなかった。

<図38−5>

 この現象は、各試行時に生じるかい(逃)避学習反応の成立が、それにより後に生じたてんかんによって抑制されるという見方から、逆行抑制 retroactive inhibition と呼ばれる。逆行抑制が生じることは次のように説明される。試行ごとの学習の結果、脳内に生じた「変化」は最初不安定なもので時間とともに安定したものとなる。したがって、この「変化」が安定化する前にECSを与え、この安定化を阻害すると、この「変化」も阻害され、したがって学習は成立しがたくなる。このような仮想的な「変化」の安定化を記憶の固定化 consolidation of memory という。置ったん固定化した記憶は容易に消失しない。
 脳震とうや頭部電撃療法後に、その前しばらくの間の出来事の記憶が消失することがある。この記憶消失を逆行性健忘 retrograde amnesia という。この現象と上記の実験的な現象は同等のものと考えられる。

§9.記憶の基礎過程に関する説
 記憶過程がこのように2段階あることから、次のような仮説が呈示されている(Hebb, 1949)。第1段階は脳内神経回路を神経インパルスが回り続けている状態である。つまり動物がある環境に遭遇したとき、間隔器から入力した情報が神経インパルスとして脳に達し、ある特定の神経回路(たとえば反響回路)を回り続ける状態である。第2段階は、上記インパルス活動の結果、神経回路のどこかに構造的ないし物質的変化が生じたことに対応していると考えられる。このような物質的変化を心理学では記憶痕跡 memory trace または memory engram と呼ぶ。
 第一過程で主張される神経インパルスの特定神経回路での循環の発生には、循環回路を作っているシナプスを通過する神経インパルスの多少によって、そのシナプスの伝達効率が、長期にわたって変化する事が必要であろう。近年、中枢神経内、海馬や、大脳視覚野のシナプス前線維を高頻度で連続刺激すると、長時間(数時間から数日)シナプスの促通が生じることが見いだされ、その機構について調べられている。この現象は、長期増強 long-term potentiation と呼ばれ(xx頁参照)、記憶の第一過程の基礎をなすものでないと、注目されている。
 第二過程として脳内に引き起こされる構造的変化(記憶痕跡)の本態として、しばしば核酸とタンパク質が取り上げられている。代謝阻害物質を脳内に注入すると、ニューロンのタンパク質および核酸の合成が阻害される。それと同時に迷路学習、回避学習の成立阻害される。ところが、学習成立後、1週間以上たってから阻害物質を脳内に注入しても、その学習行動は影響されないという。そのことから、核酸およびタンパク質が記憶痕跡の成立と密接な関係をもつと考えれている。
 このように記憶の基礎に関しては諸説が主張されているが、その詳細は現在のところ不明である。

§10.二次強化とより高次の学習
 ある刺激は、前に述べたように生得的に行動を強化する性質を持っている。たとえば、飢えた動物において食餌は一連の行動を強化する。このような強化因子を一次強化因子 primary reincorcer という。これに対し学習の結果、強化能力を獲得した強化因子を二次強化因子 secondary reinforcement という。高次の学習は、二次強化さらに、より高次の強化によって成立すると考えられる。さらにヒトでは言語学習が加わり、より複雑な学習が形作られている。ヒトの判断とか、計画を立てるという機能も、過去の経験の〈記憶〉にもとづいた複雑な学習行動とみることができる。

§11.記憶の臨床的研究
 臨床的に記憶と密接な関係を持つといわれてきた部位の1つに、大脳皮質側頭葉がある。19世紀にJackson は、側頭葉の鈎 uncus に焦点をもつてんかん患者の例を記載した。患者は発作に先立って過去の体験をありありと想い出した。今世紀に入って Penfield は、脳手術の際、脳を直接電気刺激することを試みた。側頭葉外側部の刺激によって、昔経験した景色がみえたり、音楽が聞こえてきたりすることを見いだした。このとき、想起 recall は過去の経験と時間的関連なく現れ、刺激を止めると中断した。側頭葉内側面である海馬を刺激すると、上のような想起ではなく、逆に記憶の障害を起こす。自動症 automatisum が生じるのと同時に意識が混濁し、刺激中の出来事を想い出せない。
 また、てんかん治療の目的で側頭葉を両側摘除すると、記憶保持の障害が生じる。記憶障害は比較的新しい経験のそれが著しく、古い記憶は影響を受けない。また側頭葉摘除の際、海馬損傷が加われば加わる程、障害は大となる。
 アルコール性コルサコフKorsakoff 症候群でも、比較的新しい記憶の保持が障害される。病理解剖した例では、乳頭体、視床の背内側核等が侵されているという。さらに近年、初老期以後に生じる痴呆、特にアルツハイマー病が注目されている。この病気は、認知障害を伴うが、初期の症状は短期記憶の障害である。この病気の病理学的特徴は皮質に neuritic plaqe が現れることである。また、海馬および新皮質のコリンアセチルトランスフェラーゼの低下もみられる。
 以上から、臨床的には海馬およびその周囲の皮質、乳頭体、視床の一部の核が記憶と密接な関係をもっていることが示唆される。しかし、そこに記憶が貯蔵されているのではなく、そこが記憶の貯蔵を調節している、と考える人が多い。記憶痕跡そのものは、脳の広い部位に分布していると考えられる。