ソフトウェア

Googleの医療面接特化AI「AMIE」は人間よりも正確な診断が可能&患者への印象に優れるという研究結果が報告される


病気やけがをした際、病院やクリニックでは医師と患者の間で「医療面接」と呼ばれる、症状や病歴の聞き取りなどの情報交換が行われます。Googleが開発した新たなAIモデル「Articulate Medical Intelligence Explorer(AMIE)」は医療面接に特化しており、独自の調査では、人間の医師よりもAMIEの方が適切な診断を下すだけでなく、患者に対する印象が優れていたことが報告されています。

[2401.05654] Towards Conversational Diagnostic AI
https://arxiv.org/abs/2401.05654

AMIE: A research AI system for diagnostic medical reasoning and conversations – Google Research Blog
https://blog.research.google/2024/01/amie-research-ai-system-for-diagnostic_12.html


Google AI has better bedside manner than human doctors — and makes better diagnoses
https://www.nature.com/articles/d41586-024-00099-4

医療面接では、患者との対話を適切に行うことで、病歴の把握や適切な処置について決定することが可能になるだけでなく、患者の感情に共感的に反応することで、患者のメンタルケアも同時に行うことが可能とされています。


しかし、従来の大規模言語モデルは、医療分野に関する論文の要約や医学的な質問への回答などのタスクを正確に実行することは可能でしたが、これまで医療面接を目的として開発されたAIはほとんどありませんでした。

Google ResearchとGoogle DeepMindの研究チームが共同となって開発したAMIEは、医療面接に最適化された対話型の医療AIです。研究チームによると、AMIEは臨床医と患者の両方の視点からトレーニングされています。

さらに、「トレーニングデータとして使用できる現実世界の医療に関する会話が不足している」という課題に対応するため、研究チームはセルフプレイベースの模擬対話環境を開発し、AMIEに自動フィードバック機能を搭載しました。その結果、AMIEは多数の病状や専門分野、シナリオに対応することが可能となり、対話とフィードバックを繰り返すことで応答が徐々に洗練されていき、患者に対する正確かつ根拠のある返答を導き出すことができるようになっています。


AMIE開発の際には、まず電子カルテや文章化済みの医療面接など、現実世界のデータセットを用いて基本の大規模言語モデルの微調整が行われました。その後、研究チームは大規模言語モデルで、架空の患者について、病歴の理解や診断を行うように指示を出すトレーニングを繰り返しました。

研究チームは最終的に、20人の被験者に対し、対話を行っているのがAMIEなのか人間の医師なのかを伏せた状態で、オンラインチャットを通して医療面接を行う実験を行いました。被験者には149件にのぼる面接シナリオを行い、面接の評価を行うように求められました。

実験の結果、AMIEは「診断の正確さ」「治療に対する信頼感」「医師の誠実さ」「医師からの共感」「指示の的確さ」「患者の健康管理」という検討した6つの医療専門分野全てにおいて、人間の医師の診断精度に匹敵またはそれを上回る結果が得られました。


また、AMIEは「礼儀正しさ」「病状や治療の説明」「誠実さ」「患者への気遣い」など、会話の質に関する26項目において、24項目で医師を上回ったことが報告されています。以下はその結果を示したグラフです。ほとんどの基準で、AMIE(赤)の方が医師(青)よりも会話の質が高いことが明らかになっています。


加えて、人間の医師が医療面接の際にAMIEを使用することで、診断精度が大幅に向上することが明らかになりました。以下のグラフはAMIE使用の有無による診断の精度を示したものです。一切サポートも用いない場合(青)に比べ、インターネット検索も併用する場合(緑)やAMIEも用いる場合(黄)では診断精度が大幅に向上しています。なお、今回の実験ではAMIEが医療面接を行うケース(赤)で、診断精度が最も高くなりました。


一方で研究チームのアラン・カーティケサリンガム氏は「今回の結果は、AMIEが決して医師よりも優れているということを示すものではありません」と指摘。カーティケサリンガム氏によると、この研究に参加した医師は、テキストベースでのチャットを通じて患者と医療面接を行うことに慣れておらず、その結果パフォーマンスの低下につながった可能性があるとのこと。

それでも、AMIEには「一貫性のある回答を素早く生成できるという利点があるほか、疲れを知らないAIはどんな患者にも一貫して思いやりを持つことが可能です」と述べています。

次のステップとして、研究チームは「実際に病気を抱える患者でAMIEをテストするための倫理的要件の調査」を挙げています。デューク大学医学部の臨床医兼AI開発者であるダニエル・ティン氏は「AMIEを利用することになる患者のプライバシーも考慮すべき重要な側面です。現状の大規模言語モデルの問題点は、データがどこに保存され、どのように分析されているのか、明らかにされていないケースが数多く存在することです」と指摘しました。

この記事のタイトルとURLをコピーする

・関連記事
「医療」に特化したオープンソースの大規模言語モデル「Meditron」が登場 - GIGAZINE

Googleの医療用AIチャットボットがすでに医療機関でテストされている - GIGAZINE

3年間で17人の医師が見つけられなかった少年の痛みの原因をChatGPTが特定することに成功 - GIGAZINE

医師は患者の意見を「最もどうでもいい情報」だと思っているとの調査結果 - GIGAZINE

Googleが大規模言語モデル「PaLM 2」を発表、すでに25のGoogleサービスに導入済み - GIGAZINE

in ソフトウェア,   サイエンス, Posted by log1r_ut

You can read the machine translated English article here.