News Release

機械学習により「動物の行動戦略」を解読

動物は何を報酬として行動しているのか

Peer-Reviewed Publication

Kyoto University

Tracking Where They Go

video: This is a video of automated-tracking of multiple nematodes (C. elegans) on a thermal gradient. view more 

Credit: Kyoto University / Honda Lab

私たちヒトや動物は、より多くの報酬を得るため、状況に応じた「行動戦略」を持って生きています。報酬には食べ物やお金など実態の伴うものだけでなく、間接的にそれらに結びつくものも含まれているため、自由に行動している動物を単に観察しているだけでは、「動物が何を報酬として意思決定を行い、行動しているのか?」を知ることは困難でした。

そこで私たちは、動物の行動時系列データから報酬に基づく行動戦略を明らかにする機械学習法(逆強化学習法)を提案しました。逆強化学習法の応用先として、シンプルなモデル動物である線虫C. elegansの温度走性行動に注目しました。線虫を温度勾配においてトラッキングすることで、行動時系列データを取得し、そして逆強化学習法により、線虫にとって何が報酬となっているのかを推定しました。

その結果、餌が十分ある状態で育った線虫は、「絶対温度」および「温度の時間微分」に応じて報酬を感じていることが明らかとなりました。この報酬に基づく戦略は一つは効率的に成育温度に向かうモード、もう一つは同じ温度の等温線に沿って移動するモードから構成されていました。さらに、推定された報酬を用いて、線虫行動をコンピュータでシミュレーションしたところ、線虫の温度走性行動が再現され、逆強化学習法の妥当性が示されました。

ヒトや動物は、さまざまな状況に対してそれぞれ価値付けを行い、より価値の高い状況を目指す戦略を取っていると考えられます。今回私たちは、動物の行動データからその裏に潜む戦略を解読する計算論的手法を提案しました。この手法を用いることで、動物が何に価値を置いて行動しているのかを定量化することに成功しました。今後、この手法によって明らかにされる行動戦略と神経活動データを比較することで、行動戦略を司る神経メカニズムの解明に寄与することを期待しています。

###


Disclaimer: AAAS and EurekAlert! are not responsible for the accuracy of news releases posted to EurekAlert! by contributing institutions or for the use of any information through the EurekAlert system.