東京医科歯科大学医学部附属病院消化器内科の竹中健人助教と東京医科歯科大学高等研究院の渡辺守院長と東京医科歯科大学医学部附属病院光学医療診療部の大塚和朗教授のグループは、ソニーイメージングプロダクツ&ソリューションズ株式会社に共同研究の協力を得て、潰瘍性大腸炎内視鏡画像に基づくコンピューター画像支援システム(DNUC; deep neural network system based on endoscopic images of ulcerative colitis)を試験的に開発しました。この研究は「東京医科歯科大学とソニーイメージングプロダクツ&ソリューションズ(株)の包括連携プログラム」の支援のもとでおこなわれたもので、その研究成果は、国際科学誌 Gastroenterologyに、2020年2月11日にオンライン版で発表されました。将来的に潰瘍性大腸炎に対する内視鏡評価の方法を変えるツールとすべく、今後は実用化にむけて検討を進めます。
【研究の背景と目的】
潰瘍性大腸炎※1は慢性の炎症性腸疾患で、症状の寛解と増悪を繰り返し、日常生活の質に強く影響する病気です。近年の治療の進歩の結果、症状を抑えるだけでなく、病気の炎症そのものをコントロールすることが可能となりました。炎症のコントロールためには症状寛解だけでなく「粘膜治癒」を達成することが重要であり、下部消化管内視鏡※2を行い「内視鏡的な寛解」および「組織学的な寛解」を評価することが必須です。しかしその評価を行うには病気に対する知識や経験が必要であり、医師の主観に基づくため相違が生じる※3ことが問題でした。さらに「組織学的な寛解」評価のためには内視鏡検査で粘膜生検※2を採取する必要があり、採取に伴うコストや合併症が避けられません。
人工知能(AI)技術の進歩により、医療の領域でも様々なコンピューター支援機器の開発が進められています。本研究では深層学習というAI技術を用いることで、潰瘍性大腸炎の内視鏡画像に基づくコンピューター画像支援システム(DNUC)を開発し、その精度を前向き※4に検証することを目的としました。
【研究成果の概要】
2014年1月から2018年3月までに東京医科歯科大学医学部附属病院にて潰瘍性大腸炎患者に施行された下部消化管内視鏡の画像と粘膜生検を見直し、AI学習に適切と思われるデータ(2012名、40758画像、6885粘膜生検)を収集しました。その後にすべてのデータに対してUCEISスコア※5とGeboesスコア※6を専門医により点数付けしました。本研究ではUCEISスコア0点を「内視鏡的な寛解」、Geboesスコア3.0以下を「組織学的な寛解」と定義しました。このデータセットを学習データとして用い、ソニーイメージングプロダクツ&ソリューションズ株式会社の協力を得てDNUCを開発しました。入力された画像をもとにDNUCはUCEISスコアと「内視鏡的な寛解」と「組織学的な寛解」を出力します。
開発したDNUCの精度は2018年4月から2019年4月まで前向きに検証しました。下部消化管内視鏡を行う潰瘍性大腸炎患者に対し、この研究について説明し文章同意を得た上で、内視鏡検査と粘膜生検を行いました(875名、4187画像、4104粘膜生検)。内視鏡評価については潰瘍性大腸炎の専門医3名の合議によって決められ、組織評価については病理専門医および潰瘍性大腸炎の専門医の合議によって決められました。これより得られたデータを検証用データとして解析したところ、DNUCの「内視鏡的な寛解」に対する精度は90.1%、「組織学的な寛解」に対する精度は92.9%でした。
【研究成果の意義】
本研究の意義として3点考えています。
①DNUCを開発し、その精度を前向きに検証しました。
DNUCの精度検証のため我々は前向き研究を行いました。これまで医療分野のAI研究の多くはすでにある過去のデータセットを学習用データと検証用データに分け、AIに学習させたのちに検証用データに対し精度評価を行っていました。しかし、この方法はAIの学習システム自体を評価しているにすぎず、実際に開発されたシステムが臨床応用できるかは不明でした。一方、我々は検証用データを実際の臨床現場に即した形で収集し、そのデータに対しDNUCの精度検証を行いました。その結果DNUCは良い精度を示し、臨床現場でも将来的に実用可能であることが分かりました。
②AIにより潰瘍性大腸炎専門医と同等の一定の内視鏡評価が可能となりました。
DNUCは「内視鏡的な寛解」を潰瘍性大腸炎の専門医と同様に高い精度で評価することが可能でした。内視鏡評価は主観的であり医師間でも相違があるため、90.1%という精度は、潰瘍性大腸炎内視鏡評価に関する過去の論文結果と比較して十分に高い結果でした。DNUCは同じ画像からは常に同じ内視鏡評価を出力しますので、「いつでも」「どこでも」「だれでも」同様の内視鏡評価が可能となります。DNUCにより将来的には病気の重症度や治療効果を評価する基準となると我々は考えております。
③ AIにより粘膜生検を採取しなくても組織学的評価が可能となりました。
DNUCは内視鏡画像のみから「組織学的な寛解」を評価することが可能でした。組織評価のためには粘膜生検の採取が必要でしたが、DNUCを用いると内視鏡施行中にどの画像からでも組織評価をすることが可能であり、生検に関連するコストとリスクを無くすことができます。さらにDNUCを改良することで、必要な粘膜生検の回数を減らすことができると考えており、引き続きソニーイメージングプロダクツ&ソリューションズ株式会社との包括連携プログラムに基づき、本システムを内視鏡動画へ適応させる研究を進めて行く予定です。
我々はDNUCが臨床現場で必要となることを強く確信し、臨床応用できることを目指しています。将来的には世界中で、潰瘍性大腸炎に対する内視鏡評価の方法や基準が変わる可能性を期待しています。
【用語解説】
※1 潰瘍性大腸炎は大腸の粘膜にびらんや潰瘍ができ、腹痛や血便を伴う下痢を起こす原因不明の病気です。症状が強い場合には、日常生活に著しい影響があり、入院や大腸全摘術が必要になることもあります。厚生労働省の難病対策における「指定難病」の一つであり、特定医療費受給者証所持者はH30年度で約12万人います。(資料は難病情報センターより)
※2 下部消化管内視鏡とは肛門から内視鏡を挿入し、主に大腸を評価するための内視鏡です。下部消化管内視鏡検査で大腸の粘膜の状態を評価することで潰瘍性大腸炎の診断や治療効果の判定ができます。また内視鏡の先端から器具を出し、大腸粘膜の生検を採取し、組織学的(顕微鏡的)な炎症や癌の評価をすることも可能です。内視鏡を行い粘膜生検を行った日から病理医の診断までは下記のような処理が必要であり、平均1週間程度必要です。
※3 人による評価は主観的であり医療現場では時に問題となります。評価をするによって評価が異なってしまうことを「評価者間差異」といい、同じ人でも異なる日で評価が異なってしまうことを「評価者内差異」といいます。本システムではAIは常に一定の結果を出力しますので、常に一定の客観的評価を行うことが可能です。
※4 前向き研究とは、研究の評価項目をあらかじめ決め、対象となる患者に研究の目的や方法を説明し同意のうえ、ある時点から将来に向かって研究を進めることを言います。反対の言葉として後向き研究があり、これは過去のデータや患者情報を用いて解析する研究方法です。
※5 UCEISスコアは潰瘍性大腸炎に対する内視鏡スコアで、治験や臨床研究でも用いられ、世界中でスタンダードとなっています。再軽症の0点から最重症の8点まで9段間のスコアです。
※6 Geboesスコアは潰瘍性大腸炎に対する生検組織スコアで、治験や臨床研究でも用いられ、世界中でスタンダードとなっています。再軽症の0点から最重症の5点までの段階があるスコアです。
###
Journal
GASTROENTEROLOGY