Deep Learningで人がいつ死ぬかを正確に予測できるようになった。アルゴリズムに医療データを入力すると、医師より正確に患者の死亡時期を算出する。AIに余命を宣告されるのは違和感を覚えるが、病院ではこれが重要な情報となる。

出典: Stanford Medicine |
スタンフォード大学の研究
スタンフォード大学の研究チームは入院患者の余命をDeep Learningで予測する研究成果を発表した。論文「Improving Palliative Care with Deep Learning」によると、アルゴリズムは患者の余命を93%の精度で予測する。この研究成果は終末期医療を上手く運営するために使われる。現在は医師が終末期医療が必要な患者を選び出すが、余命を長めに推定する傾向が強く、多くの患者がケアを受ける前に亡くなっている。
Palliative Care
スタンフォード大学大学病院 (上の写真) は終末期医療を提供している。これはPalliative Care (パリアティブ ケア) と呼ばれ、余命一年以内の患者を対象とし、治療を進めるとともに本人の意思を尊重し、苦痛や不安を和らげる処置も取られる。Palliative Careは患者とその家族の生活の質を向上させることを目的にしている。
ケアを受ける患者
大学病院はPalliative Careを運営するものの、この治療が必要な患者を上手く特定できないという問題を抱えている。このケアが必要な患者とは余命が3か月から12か月の患者と定義している。このケアを受けるには前準備で3か月かかり、また、12か月を超えてケアを継続するには医師やナースの数が足らない。
医師による余命の算定
このため、担当医師が余命が3か月から12か月の患者を特定し、Palliative Careに移管する仕組みとなっている。しかし、多くのケースで担当医師は患者の余命を長めに予測する。そのため、患者の多くはPalliative Careを受けることなく死亡する。医師は患者の電子カルテのデータを参照し、今までの経験から余命を推定する。人間としての定めなのか、余命の算定は長めになる場合が多い。
患者データとアルゴリズム
このような背景のもとでDeep Learningによる余命算定の研究が進められた。アルゴリズム開発で、スタンフォード大学病院の患者データベース「Stanford Translational Research Integrated Database Environment」が使われた。これは患者の電子カルテ情報を集約したもので、アルゴリズム教育と検証に使われた。患者医療データをアルゴリズムに入力すると、死亡時期を算定する。具体的には、Deep Learningモデルは、患者が3か月から12か月以内に死亡するかどうかを判定 (Binary Classification) する。
アルゴリズム教育
アルゴリズム教育のために221,284人の患者のデータが使われた。この中には3か月から12か月の間に亡くなった患者(15,713人)と、12か月を超えて生存した患者(205,571人)が含まれている。これらのデータを使ってDeep Learningアルゴリズムを教育し、その結果が検証・試験された。

出典: Nigam H. Shah et al. |
ネットワーク構造
アルゴリズムはDeep Neural Networkで、入力層と中間層 (18段) と出力層から成る。入力層は13,654のディメンション (13,654種類のデータを入力) で、出力層はスカラーで3-12か月の間に死亡する・しないを判定する。ネットワーク構造はトライアルエラーの方式で多くのモデルが試された。これはHyper-Parameter検索と呼ばれ、ネットワークの基礎となる構造 (ネットワークの段数やアクティベーションファンクションの種類など) を決めていく。
アルゴリズムの評価
完成したアルゴリズムは様々な角度から評価された。対象となる患者を判定する精度 (AUC) は0.93で (上の写真)、100人の患者を選ぶと93人が正しいということになる。また、評価指標として「Precision Recall」を示している。アルゴリズムのPrecision (精度) が0.9の時、Recall (範囲) は0.34をマークした。アルゴリズムの精度が0.9のとき、全対象患者の0.34をカバーするという意味になる。アルゴリズムは精度が高く病院で使えることを示している。
アルゴリズムの判定メカニズム
この研究ではアルゴリズムの精度だけでなく、アルゴリズムが判定した根拠を解析する試みが行われた。複雑な構造のネットワークを直接解析するのは難しいので、入力するデータのパラメーターを変更することで、アルゴリズムが判定した根拠を導き出した。つまり、アルゴリズムのブラックボックスを開けて、その仕組みを垣間見たことになる。
医学的な根拠は
入力データのパラメータを変更することで、患者の生存率を判定する要因を導いた。入力データの種類は、病状だけでなく、治療措置や検査回数など幅広い情報を含む。その結果、アルゴリズムが死亡時期を判定するときに重視した項目は、膀胱腫瘍、前立腺腫瘍、病理検体摘出措置、放射線検査回数などとなる。病気の種類で余命が決まることは直感的に理解できるが、アルゴリズムは病理検体が抽出されることやMRI検査などの回数から死亡時期を算出した。これ以上の説明はないが、MRI検査を頻繁に受けることは、ガンが転移していることの傍証になるのかもしれない。
米国でPalliative Careが広がる
米国内で多くの病院がPalliative Careの導入を進めている。2008年には病院の53%がこのケアを提供していたが、2015年には67%に増加している。Palliative Careを提供する病院が増えているものの、必要な患者の7-8%しかこのケアを利用していないという統計もある。このギャップは病院側のリソース不足に加え、上述の通り、担当医師が対象となる患者を正しく判定できないという問題がある。このため、Deep Learningなどテクノロジーの果たす役割が期待されている。