前頭連合野は前頭葉の前半部を占め(図1)、複雑な行動を制御する大脳の領域として知られています。前頭連合野の外側部や腹側部の機能についてはこれまでの研究である程度の知見が得られていますが、内側部の機能についてはほとんど分かっていませんでした。
ある刺激が与えられたときにある特定の行為をすると報酬が与えられるという経験を何度も繰り返すと、刺激と行為が脳の中で連合し(固く結びつき)、刺激から行為が自動的に起こる習慣的行動が形成されます。習慣的行動は固定した環境で効率よく行動するために有利です。しかし、動物はもっと目的を意識して行動する場合があります。そのような場合には、環境刺激が示されると、まず最近の経験の中でこの刺激に結びついて得られた報酬が意識され、次に最近の行為-報酬関係の経験に基づいて行為が選ばれ実行されます。報酬予測に基づく行為選択の学習の方が習慣的行動の学習より速いので、刺激-行為-報酬の関係が頻繁に変化する状況で動物は報酬予測に基づく行為選択を行います。今回の研究では、報酬に基づく行為選択のメカニズムを明らかにするために、サルを頻繁な条件変化を伴う行動課題で訓練し、前頭連合野のいろいろな部位から神経細胞活動を記録しました。
サルを訓練した行動課題では、2つの刺激、2つの行為、2つの報酬を用いました(図2)。まず2個の視覚刺激(花1、花2)のどちらかの刺激がテレビに示され、サルは刺激に対応する行為(行為1-レバーを引く、または行為2-真ん中の位置に保持する)を行います。正しく対応した行為をすると、それぞれの行為に対応する報酬(報酬1-ジュース、または報酬 2-音)が与えられます。間違った対応の行為をサルがするとどちらの報酬も与えられません。刺激―行為の習慣的行動が発達するのを防ぐため、数十回ごとに刺激―行為―報酬の対応関係を変えました。対応関係が変わるごとに、サルは刺激と行為の対応関係を試行錯誤で学習しなければなりません。いくつかの行動実験でサルの行動を調べた結果、サルが報酬の予測に基づいて行為を選んでいたことが分かりました。
課題遂行中のサルの前頭連合野のいろいろな部位から微小電極を用いて神経細胞の活動を記録したところ、刺激が出た途端にまず報酬予測を表現する神経細胞活動が前頭連合野全体に広く表れ、続いて報酬の予測と行為の意図を同時に表現する第二のタイプの神経細胞活動が前頭連合野の内側部に限局して表れました。第二のタイプの活動は、特定の報酬が予想され、さらに特定の行為が行われる条件でだけ起こりました。この神経細胞活動は、報酬予測に合致する行為―報酬の組み合わせを思い出し、行為を選ぶ過程に対応すると思われます(図3)。
報酬予測を表す神経活動が前頭連合野の広い領域に現れることは既に分かっていましたが、今回の研究は、報酬予測から適切な行為を選ぶ神経プロセスが前頭連合野の内側部で起こっていることを明らかにしました。報酬は目的の最も単純な形態です。前頭連合野の内側部は特定の目的と行為の組み合わせを表す神経細胞集団を持つことによって、目的から行為を決めるプロセスに中心的な役割を果たすことが示唆されました。