image: (Left) DMPFC neurons encoding positive O-RPE, (Right) DMPFC neurons encoding negative O-RPE
Credit: Masaki Isoda
自分は、この行動によって、どのぐらい報酬を得られるだろう?
他人は、どのぐらい報酬を得るのだろう?
生物にとって、自分が起こす行動が、どのぐらいの報酬をもたらすのか、といった、未来の出来事を予測する能力を獲得することは、非常に重要です。また、我々のような社会的な動物にとっては、他人がどのぐらいの報酬を得るのか、という情報を予測することも、同時に重要な能力となってきます。こうした能力の獲得には、実際に得られた報酬と事前に予測した報酬との差を表す、報酬予測誤差と呼ばれる信号が脳内で使われていると考えられています。生理学研究所の磯田昌岐教授らは、自分の得た報酬の予測誤差と、他者が得た報酬に対する予測誤差は、前頭葉の一部である内側前頭前野で同時に表現されていることを明らかにしました。
これまでの研究により、中脳に存在するドーパミンを分泌するニューロンの活動が自己の報酬予測誤差信号として働くことが明らかになっています。一方、他者の報酬予測誤差信号がどの脳領域の神経活動で表現されているのかは、これまで明らかになっていませんでした。今回、他者のこころの予測に重要とされる内側前頭前野のニューロンが他者の報酬予測誤差を表現するのではないかと考え、ニホンザルをモデル動物として、実験を行いました。
実験では2頭のサル(自己と他者とします)を対面させ、自己と他者の報酬(ジュース)の量を予測できる課題を行っている際に、内側前頭前野のニューロン活動を記録しました。その結果、約19%のニューロンの活動が他者の報酬予測誤差と相関することがわかりました。また、それとは異なる約6%のニューロンの活動が自己の報酬予測誤差と相関することもわかりました。興味深いことに、これらの2群のニューロンは報酬予測誤差が生じるタイミングで同時に活動しました。この結果は、脳内では自己と他者の報酬を予測するための学習が同時並行で進行することを示しています。さらに内側前頭前野には、自己と他者の報酬が「どれだけ予測どおりに与えられたか」を表す、報酬予測誤差とは真逆の情報も含まれていることがわかりました。
磯田教授は「我々は、自分の行動だけではなく、他者の行動も観察することで、より効率的に、外界刺激がどのような価値を持つのかを効率的に学習しています。今回の研究から、そのような仕組みの一端が明らかとなりました。私たちの最終的な目標は、「他者のこころの推定」の根底にある脳のメカニズムを理解することです。特に、今後は人工知能を活用し、人工的なニューラルネットワークと実際の生物の脳における情報処理の比較も行っていきたいと考えています。」と語ります。
Journal
Cell Reports
Method of Research
Experimental study
Subject of Research
Animals
Article Title
The macaque medial prefrontal cortex simultaneously represents self and others’ reward prediction error
Article Publication Date
25-Mar-2025