News Release

特別号:予測

Peer-Reviewed Publication

American Association for the Advancement of Science (AAAS)

将来何が起きるかを知りたいという強い願望が常に私たちにはある。科学のおかげでこれまで以上に正確な予測ができるようになってきており、これは特に機械学習の台頭による部分が大きい。今回の特別号「予測」では政策や政治的暴力、人間活動といった分野での重大結果の予測方法の進歩や課題について深く掘り下げて考察している。Ryan Kennedyらは研究で最大90%の正確さで選挙結果を予測できるモデリング技法を発表している。Kennedyらの研究結果により、予測には投票データが極めて有効で、バイアスを修正することでさらに精度が上がることが示された。現行の予測方法ではドナルト・トランプ氏の選挙人団の勝利を予測できなかったことから、選挙を予測する計量的手法に対する批評が新たに高まった。大統領選挙の結果予測に有効なのはどういった要因かをさらに詳しく知るために、Kennedyらは1945~2012年の86ヵ国621回の選挙データを集計した。その結果、興味深い相関関係が多数発見された。たとえば、政治体制の開放性と現職政党の政権維持の可能性には強い負の相関関係があった。さらに、アメリカとの関係が良好だと現職政党の政権維持の可能性は高かったとKennedyらは報告している。Kennedyらの分析により、選挙で公表された投票数が5に満たないような不十分な投票データであっても、投票データは他の変数よりも世界の大統領選挙の予測には非常に有効であったことが判明した。その上、投票数そのものだけを使用するのではなく、投票データを集めて「平滑化した」投票予測を作り世論を調査することで、予測精度を向上することができた。大雑把な投票データの使用で80%の正確さで選挙結果を予測することができ、「平滑化した」投票予測を使用すると精度は90%にまで上がった。驚いたことに経済指標はわずかに有効であったにすぎない。Scienceニュース部門による記事で今回の研究結果をさらに詳しく説明している。

Lars-Erik CedermanとNils B. WeidmannはEssayで政治的暴力の予測の課題について論じている。これは背景事情に左右される部分が大きく、それゆえに1つの政治的暴力と別の政治的暴力を比較することは難しい。たとえば同一地域であっても時によって状況が異なる場合がある。政治的暴力を予測するこれまでの試みは失敗しているが、神経回路網のような機械学習技術に依存した新しいモデルの中にはより正確に予測できるものもある。特異な政治的暴力事件の予測は特に困難で、これはモデルが一般的に平和と暴力の可能性を同じバランスにするためである。しかし、大半の地域では平和な時期が大半を占める。この問題は様々な再サンプリング技術で対応することが可能で、結果としてそのモデルの予測精度は全体的にかなり上がるとCedermanとWeidmannは述べている。政治的暴力の予測モデルはかなり進歩した。ただ、そのようなツールは起こりうる展開の予測には最適でも特定の政治的忠告を行うものではないと思われるとCedermanとWeidmannは結論づけている。

別のEssayではAaron Clausetらがいつ誰が科学的大発見をするかを予測する方法を考察している。これは出版社や資金提供機関が原稿や研究事業計画をどう評価するかを知らせるのに役立つ。Clausetらは科学的大発見の予測に有効な4つの大きな要因を取り上げている。具体的には、過去の発見の引用、専門的な研究に採用された研究者、および、キャリアを通しての科学的生産性と重大発見の時期である。Clausetらは各要因を深く検討した後、大発見の予測モデルに依存しすぎないように警告している。依存しすぎると、イノベーションを迂闊に奨励したり、科学体系における今の不均衡を増幅させたりする可能性がある。

Philip E. TetlockらによるEssayでは政治討論という扱いの難しい分野を掘り下げて考えている。これは予測結果の可能性についての主張の競い合いに左右されることが多い。2011年、米国の情報先端研究開発局(Intelligence Advanced Research Projects Activity)は最高の精度で可能性を予測する要因を突き止めようと4年間の予測トーナメントを開催した。その結果、投票の集計が人々から考えを引き出すのに最も効率的で、最も有効な計算方法であることが判明した。また最も精度の高い予測ができる人は虚心さの評価で並外れたスコアを出すことが判明した。最後に、詳細がマイクロスケールで説明されれば、結果としてマクロレベルでのより正確な予測が可能になる。トーナメントでは多数の視点から物事を見ることも奨励されており、そのことがそうでなければ了見の狭い心を開かせ、不必要に分極化した論議をまとめるのに役立つとTetlockらは述べている。

別のEssayではSusan Atheyが政策決定のために機械学習を利用した予測方法を使用する際の課題について議論している。教師付き機械学習(Supervised machine learning:SML)ではトレーニングデータセットをインプットし、新しいデータについての予測に使用できるパラメーターを予測つまり「学習」する。しかしAtheyは、「画一的な」SMLでは基本的前提や不安定要因を正確には捉えられないことがあると述べている。たとえば、市政で保安監察官をどう配備するかを決めるためにSMLを使用する際、違反する可能性が高い組織はどこかを知るだけでは適切な意思決定には不十分である。他の組織にもそれよりは低くても危険性は予測されるが、大幅な改善は簡単で費用もかからない。たとえば、建物は配線が古いと火事のリスクが高いが、他の要因を考えると配線を交換することは難しい。Atheyは他の例も複数挙げて、政策の因果効果を特定することが最も重要だとし、SML技術を改良することで一貫性ある有効な因果効果の予測は可能になると述べている。

Jake M. HofmanらのEssayでは、社会科学では因果メカニズムが重視されることが多い一方で、予測の精度については関心が払われていない点を研究している。これまでの研究で、Hofmanらはツイッターのデータをどのように操作すれば同一の質問に対して質的に異なった回答が出るかを明らかにした。Hofmanらはこの現象について複数の説明を行い、研究者らが自分たちの調査結果が確実に予測に役立つようにするために行える事情固有の手順の概要を示した。アドバイスとして、科学者がオープンアクセスな枠組みの中で予測プロセスについて熟知することをHofmanらは奨励している。

最後に、V. S. SubrahmanianとSrijan KumarはEssayで人間の活動をより正確に予測する際の4つの主要課題についてまとめている。大規模データセットの背景ノイズ、特異事象の予測、新しく生じた現象の把握、動的因子の把握である。

###


Disclaimer: AAAS and EurekAlert! are not responsible for the accuracy of news releases posted to EurekAlert! by contributing institutions or for the use of any information through the EurekAlert system.