Skip to the content.

脳の情報処理機構に基づいて, 人間の行動原理を探求

人間は環境とインタラクションしながら意思決定や学習を行う主体であり, その行動には主体の特性に加え環境側の特性も反映されます. 本研究室では, 人間をそれを取り巻く環境も含めて理解するために, 脳の情報処理機構に基づく行動モデルの構築と, 実験的手法やデータ駆動的手法による検証によって, 人間行動の原理探求を行うとともに, 社会応用に関する教育研究を行います.

News

Members

To join our lab

Research procedures

Research topics

意思決定や学習の数理モデルを仮定し, ヒトを対象とした行動実験および脳計測実験により, 数理モデルの脳機構の解明をおこなっています. これまでの研究成果を紹介します.

  1. 時間割引の脳内モデルの解明に関する研究

    環境との相互作用により試行錯誤で最適行動を学習する理論的な枠組みである「強化学習」は, ヒトを含む動物の意思決定の脳の数理モデルとして提唱され, 脳の回路や物質系の振る舞いが調べられてきた. 申請者らは, 報酬予測に関わる脳機構を解明するために, 健常者を対象として非侵襲脳機能計測の一つであるfMRIを行い, 長期的な報酬予測および短期的な報酬予測を行うマルコフ決定問題での行動および脳活動データを, 強化学習モデルを用いて解析した. その結果, 皮質―線条体回路の腹側部が大きい割引率での予測に, 背側部が小さい割引率での予測に関わるという, 脳には異なる割引率での報酬予測が並列的に行われていることを明らかにした.

    Tanaka SC, Doya K, Okada G, Ueda K, Okamoto Y, and Yamawaki S. Prediction of Immediate and Future Rewards Differentially Recruits Cortico-Basal Ganglia Loops. Nature Neuroscience 7 (8), 887-893, 2004 Link

    Fig1

  2. 時間割引とセロトニンに関する研究

    時間割引には脳内物質のセロトニンが関わるという先行研究が, 主にラットを用いた動物実験で報告されてきたが, ヒトでは統一的な結果が得られていなかった. そこで申請者らは, 割引率とセロトニンの関係を調べるために, すぐに得られる小さい報酬と時間のかかる大きい報酬を選ぶ「異時点間選択課題」を開発し, 人為的に脳内セロトニンのレベルを調節した状態で課題実行中の行動ならびに脳活動を測定・解析した. その結果, セロトニンが通常レベルでは複数の割引率での報酬予測が線条体の腹側から背側に分布するという先行研究と一致した結果が得られた. 一方, 低下時には線条体の腹側部が, 過剰時には背側部が優勢となるという, セロトニンの働きによる線条体の活動の変化を明らかにした.

    Tanaka SC, Schweighofer N, Asahi S, Shishida K, Okamoto Y, Yamawaki S, Doya K. Serotonin Differentially Regulates Short- and Long-Term Prediction of Rewards in the Ventral and Dorsal Striatum. PLoS ONE 2 (12), e1333, 2007 Link

    Fig2

  3. 時間割引の偏りと問題行動に関する研究

    時間割引は, 経済学でも扱われる研究テーマであり, 近年は多重債務や肥満といった社会・健康問題との関連性が指摘されている. また精神疾患の症状や思春期の行動特性として見られる衝動性のモデルとして用いられている. そこで, 申請者らは意思決定モデルのパラメータと疾患や問題行動の関係を明らかにし, 社会・健康問題の理解や予防への貢献を目指した研究を行っている. 割引率が高く, 報酬と損失の割引率の非対称性 (符号効果) がない人ほど多重債務や肥満の割合が高いという経済学研究を受けて, 符号効果の脳機構を解明する実験を行った. 「報酬および損失の異時点間選択」実験課題を用いた実験において, 被験者の行動データから割引率を推定し, 符号効果 (行動での報酬と損失の時間割引率の非対称性) の見られた群と見られなかった群での脳活動を比較した結果, 符号効果という行動における報酬と損失に対する非対称性が, 線条体の活動における報酬と損失に対する非対称性に起因することを示唆する結果を得た.

    Tanaka SC, Yamada K, Yoneda H, Ohtake F. Neural Mechanisms of Gain–Loss Asymmetry in Temporal Discounting. The Journal of Neuroscience 34(16), 5595-5602, 2014 Link

  4. 時間的信頼度割付の偏りとセロトニンに関する研究

    異時点間選択で「すぐにもらえる小さい報酬」を頻繁に選ぶという衝動的選択は,割引率が高い場合に遅延報酬の重みが小さくなることで生じるが, 学習において得られた遅延報酬が直前の行動としか関連づけられない場合でも起こりうる (信頼度割付問題). これを検証するために, セロトニンのレベルを人為的に操作した状態で, 過去の行動と現在の報酬の間に時間的な遅延が発生する学習課題の行動から被験者の時間的信頼度割付の減衰率を推定した. その結果, セロトニンレベル低下時は通常時と比べ, 損失に対する時間的信頼度割付の減衰率が大きくなることを明らかにした. この結果から, セロトニンは将来の時間スケール (報酬予測の割引率) および過去の時間スケール (時間的信頼度割付の減衰率) の両方に関わることが示唆された.

    Tanaka SC, Shishida K, Schweighofer N, Okamoto Y, Yamawaki S, Doya K. Serotonin affects association of aversive outcomes to past actions. The Journal of Neuroscience 29 (50), 15669 – 15674, 2009 Link

  5. データ駆動型アプローチの導入

    上記3, 4で紹介したような, 「仮説検証型」アプローチを精神疾患患者へ応用することで, 精神疾患のメカニズムを数理モデルとして理解する「計算論的精神医学」という動きが盛んになっている. その一方, 脳・行動の多変量データと機械学習を組み合わせた「データ駆動型」アプローチにより, 特定の仮説にとらわれず”holistic”に精神疾患や個人特性のメカニズムを理解しようとする試みがなされている. その例として, 安静時の脳の結合パターンを用いた疾患の判別や, バイオタイプの同定, さらには個人特性の予測などが挙げられる. しかし精度が高くかつ汎化性能の高いデータ駆動型解析には, 大量のデータおよびうまく特徴量を抽出するアルゴリズムの開発が必要となる. 申請者は, 大規模データと各データセットの特性に合わせた効果的な機械学習アルゴリズムを用いることで, 様々な不安に共通する脳基盤を解明した. 不安を惹起させる課題中の脳活動データと, 日常に感じる不安特性と関連する安静時脳活動という異なるタイプの「不安」を反映する脳活動データに対して, 特徴量を取り出し低次元化することで, これらの「不安」に共通する脳ネットワークを同定し, この脳ネットワークから不安に関わる疾患患者を判別可能なことを確認した.

    Takagi Y, Sakai Y, Abe Y, Nishida S, Harrison BJ, Martínez-Zalacaín I, Soriano-Mas C, Narumoto J, Tanaka SC. A common brain network among state, trait, and pathological anxiety from whole-brain functional connectivity. NeuroImage 172, 506-516, 2018 Link

  6. 強迫症の数理モデルの構築と検証

    ヒトは環境から与えられる報酬や損失に基づいて, 行動を適応的に変化させながら生活していると考えられており, 近年その行動の理解は強化学習モデルを用いて深められてきた. 報酬・損失からの学習には, それぞれ皮質線条体回路の直接路・間接路が深く関わると考えられている. 学習において報酬や損失といったフィードバックは, 多くの場合行動から時間的に遅れて与えられるため, 上記4で述べた信頼度割付問題が発生する. それを実行する機構として, 適格度トレース(eligibility trace)という時間とともに減衰する記憶のトレース信号の存在が想定されている(Sutton & Barto 1998). 理論的には, 適格度トレースの減衰速度は, 報酬予測エラーが正であったときも負であったときも同じであることが求められるが, これらが皮質線条体回路の直接路・間接路に分かれてコードされていると仮定した場合, この減衰率はアンバランスとなる場合があることが想定される. 我々はこの場合に, 強迫症に見られる繰り返し行動のような非適応的行動が生じると仮説を立て, シミュレーションおよび行動実験をおこなった. その結果, 適格度トレースの減衰パラメータのバランスが取れている場合は, 繰り返し行動は決して強化されないが, 極端なアンバランスが存在するときには異常な繰り返し行動が強化されることを発見した. さらに強迫症の患者を対象とした学習課題の行動データから適格度トレースの減衰率を推定した結果, シミュレーションを支持する結果が得られた.

    Sakai Y, Sakai Y, Abe Y, Narumoto J, Tanaka SC. Trace Imbalance in Reinforcement and Punishment Systems Can Mis-reinforce Implicit Choices Leading to Anxiety. bioRxiv 2020.08.07.241588 Link

    Fig6

  7. 大規模脳・行動データベースの構築と利活用

    昨今, 結果の再現性の担保は科学分野全体の大きな課題となっているが, 脳研究でも再現性の担保のために様々な試みがされている. その中でも, 十分な統計力を保証するためのデータの大規模化およびデータシェアリングは最も重要とされている. 複数機関によるヒト脳MRI大規模データベースプロジェクトのメンバーとして, 世界的に貴重な多施設・多疾患脳 MRI データベースの構築と公開をおこなった.

    Tanaka SC, Yamashita A, Yahata N, Itahashi T, Lisi G, Yamada T, Ichikawa N, Takamura M, Yoshihara Y, Kunimatsu A, Okada N, Hashimoto R, Okada G, Sakai Y, Morimoto J, Narumoto J, Shimada Y, Mano H, Yoshida W, Seymour B, Shimizu T, Hosomi K, Saitoh Y, Kasai K, Kato N, Takahashi H, Okamoto Y, Yamashita O, Kawato M and Imamizu H. A multi-site, multi-disorder resting-state magnetic resonance image database. Scientific Data 8, 227, 2021 Link

    Fig7

Outcomes

論文などの業績はResearchmapGoogle scholoar を参照してください.

Funding

現在受給中の研究費(外部資金)は以下のとおりです.

  1. 戦略的国際脳科学研究推進プログラム (国立研究開発法人日本医療研究開発機構)
    期間(年度):2018~2023年度
    研究開発課題名:人生ステージに沿った健常および精神・神経疾患の統合MRIデータベースの構築にもとづく国際脳科学連携
    分担研究開発課題名:革新脳・脳プロ標準プロトコルによる3T-MRIデータプラットフォームの構築
    研究開発代表者又は研究開発分担者の別:研究開発分担者

  2. 科研費・学術変革領域研究A (文部科学省)
    期間(年度):2021~2025年度
    研究開発課題名:大集団脳科学による個体脳ー世界相互作用に基づく人間の当事者化の脳行動モデル構築(領域名: 「当事者化」人間行動科学:相互作用する個体脳と世界の法則性と物語性の理解)
    研究開発代表者又は研究開発分担者の別:計画班代表者

  3. 安全保障技術研究推進制度 (防衛省)
    期間(年度):2021~2025年度
    研究開発課題名:メタ認知の脳情報基盤解明と日常トレーニング環境の構築
    研究開発代表者又は研究開発分担者の別:研究開発分担者

  4. ムーンショット型研究開発事業 (国立研究開発法人科学技術振興機構)
    期間(年度):2022~2026年度
    研究開発課題名:仏教・機械・脳科学で実現する安らぎと慈しみの境地 (ムーンショット目標9「2050年までに, こころの安らぎや活力を増大することで, 精神的に豊かで躍動的な社会を実現」)
    研究開発代表者又は研究開発分担者の別:課題推進者

Contact

問い合わせはこちらからお願いします –> Googleフォームが開きます

奈良先端科学技術大学院大学 先端科学技術研究科 情報科学領域
計算行動神経科学研究室
(情報科学領域 B棟6階)