文献情報
文献番号
201903002A
報告書区分
総括
研究課題名
ビッグデータからの機械学習による前立腺癌小線源療法の予後予測法の開発と均てん化への応用
課題番号
H29-ICT-一般-002
研究年度
令和1(2019)年度
研究代表者(所属機関)
中村 和正(浜松医科大学 医学部)
研究分担者(所属機関)
- 斉藤 史郎(東京医療センター 泌尿器科)
- 萬 篤憲(東京医療センター 放射線科)
- 片山 敬久(岡山大学 大学院)
- 馬込 大貴(駒沢大学 医療健康科学部)
- 小島 伸介(医療イノベーション推進センター 医療研究開発本部)
- 菊池 隆(医療イノベーション推進センター データサイエンス研究本部)
研究区分
厚生労働科学研究費補助金 行政政策研究分野 政策科学総合研究(臨床研究等ICT基盤構築・人工知能実装研究)
研究開始年度
平成29(2017)年度
研究終了予定年度
令和1(2019)年度
研究費
6,924,000円
研究者交替、所属機関変更
-
研究報告書(概要版)
研究目的
我々は、ヨウ素125シード線源を用いた小線源療法に関する前向きコホート研究(JPOPS, Japanese Prostate Cancer Outcome Study of Permanent I-125 seed Implantation)を実施してきた。本研究には全国74施設(小線源療法を施行する施設の約70%)が参加し、2005年から2010年までに小線源療法で治療された約7000例が前向き登録された。
本研究の目的は、JPOPSによって得られたビッグデータを用いて、詳細な臨床情報を機械学習させることにより、新しい前立腺癌の予後予測システムを開発し、放射線治療の質の均てん化に資することである。
本研究の目的は、JPOPSによって得られたビッグデータを用いて、詳細な臨床情報を機械学習させることにより、新しい前立腺癌の予後予測システムを開発し、放射線治療の質の均てん化に資することである。
研究方法
1) J-POPSコホート1, 2全症例での治療成績の解析
J-POPSコホート2の約4600例(2008-2010年)のデータの仮クリーニングが終了し、J-POPSコホート1, 2を合わせた約7000例にて治療成績を解析した。
2)JPOPSコホート1、2での機械学習による予後予測精度向上の検証
POPSコホート1、2の約7000例のデータを用いて、ロジスティック回帰、サポートベクターマシン(SVM)、ランダムフォレスト(RF)、ディープラーニング(DNN)の機械学習手法を用いて、PSA再発、有害事象発生率の予測を改善できるかを検討した。入力特徴量は、特徴量を4つまたは7つに厳選した場合となるべく多くの特徴量を採用したLarge Database(44項目)のデータセットを用いた。評価法は10-fold cross- validation法を用いた。
3)新しい基準でのPSA非再発率と予後因子との関係
PSA非再発率と予後因子との関係を評価するために、Gleason分類、T因子、PSA値、BEDのみの4つの因子を用いて、回帰係数より、各々の症例でのPSA非再発確率 p(x)を求め、PSA非再発確率p(x)により、リスク分類を行い、PSA非再発率を求めた。
J-POPSコホート2の約4600例(2008-2010年)のデータの仮クリーニングが終了し、J-POPSコホート1, 2を合わせた約7000例にて治療成績を解析した。
2)JPOPSコホート1、2での機械学習による予後予測精度向上の検証
POPSコホート1、2の約7000例のデータを用いて、ロジスティック回帰、サポートベクターマシン(SVM)、ランダムフォレスト(RF)、ディープラーニング(DNN)の機械学習手法を用いて、PSA再発、有害事象発生率の予測を改善できるかを検討した。入力特徴量は、特徴量を4つまたは7つに厳選した場合となるべく多くの特徴量を採用したLarge Database(44項目)のデータセットを用いた。評価法は10-fold cross- validation法を用いた。
3)新しい基準でのPSA非再発率と予後因子との関係
PSA非再発率と予後因子との関係を評価するために、Gleason分類、T因子、PSA値、BEDのみの4つの因子を用いて、回帰係数より、各々の症例でのPSA非再発確率 p(x)を求め、PSA非再発確率p(x)により、リスク分類を行い、PSA非再発率を求めた。
結果と考察
1)J-POPSコホート1, 2全症例での治療成績の解析
J-POPSコホート1, 2の6430例を対象とし、経過観察期間の中央値5.00 年(0.07-10.8 年)にて、原病死 13例、他病死 167例であった。5年PSA非再発率は、低リスク群98.3%、中リスク群95.2%、高リスク群90.8%で、リスクが上がるほど有意にPSA非再発率が低かった(P < 0.001)。
2)JPOPSコホート1、2での機械学習による予後予測精度向上の検証
コホート1, 2の6430例のビッグデータを用いて、ロジスティック回帰、SVM、RF、DNNの機械学習手法を用いて、PSA再発の予測を改善できるかを検討した。いずれも学習データでは予測精度は0.65 - 0.9以上と高い値を示したが、テスト症例の予測精度は低かった。特に、Precision、すなわち再発と予測した症例のうち、真に再発した症例の割合はいずれも0.15以下であった。これは、「再発する」と機械学習で予測しても、15%以下の精度しかないことを意味する。前立腺癌小線源療法においては、JPOPSで取得されたデータのみでは、機械学習を用いても正確に再発するかどうかを予測することは困難であることが判明した。その原因として、前立腺癌小線源療法では、PSA再発の頻度が極めて少ないこと、および、今回のJPOPSで収集したデータ以外の因子、例えば腫瘍の遺伝子情報、患者の生活習慣等が再発に係わっている可能性があること、の2つを考えている。
3)新しい基準でのPSA非再発率と予後因子との関係
平成30年度に得られた、新しい予後分類を用いることとした。ロジスティック回帰分析にて有意であったGleasonスコア、T因子、PSA値、Total BEDの4つの因子にて、回帰係数より、各々の症例でのPSA非再発確率 p(x)を求め、PSA非再発確率p(x)により、Risk A, , Cの3群に分類し、新たなリスク分類としたところ、5年PSA非再発率は、Risk A 99.3%、Risk B 95.8%、Risk C 83.5%とNCCNリスク分類よりも明確にPSA再発を予測できた。さらに、NCCN リスク分類の各リスク群を本計算式で分類することにより、各NCCNリスク群の中から、PSA再発のリスクの高い群を抽出することが可能となった。
J-POPSコホート1, 2の6430例を対象とし、経過観察期間の中央値5.00 年(0.07-10.8 年)にて、原病死 13例、他病死 167例であった。5年PSA非再発率は、低リスク群98.3%、中リスク群95.2%、高リスク群90.8%で、リスクが上がるほど有意にPSA非再発率が低かった(P < 0.001)。
2)JPOPSコホート1、2での機械学習による予後予測精度向上の検証
コホート1, 2の6430例のビッグデータを用いて、ロジスティック回帰、SVM、RF、DNNの機械学習手法を用いて、PSA再発の予測を改善できるかを検討した。いずれも学習データでは予測精度は0.65 - 0.9以上と高い値を示したが、テスト症例の予測精度は低かった。特に、Precision、すなわち再発と予測した症例のうち、真に再発した症例の割合はいずれも0.15以下であった。これは、「再発する」と機械学習で予測しても、15%以下の精度しかないことを意味する。前立腺癌小線源療法においては、JPOPSで取得されたデータのみでは、機械学習を用いても正確に再発するかどうかを予測することは困難であることが判明した。その原因として、前立腺癌小線源療法では、PSA再発の頻度が極めて少ないこと、および、今回のJPOPSで収集したデータ以外の因子、例えば腫瘍の遺伝子情報、患者の生活習慣等が再発に係わっている可能性があること、の2つを考えている。
3)新しい基準でのPSA非再発率と予後因子との関係
平成30年度に得られた、新しい予後分類を用いることとした。ロジスティック回帰分析にて有意であったGleasonスコア、T因子、PSA値、Total BEDの4つの因子にて、回帰係数より、各々の症例でのPSA非再発確率 p(x)を求め、PSA非再発確率p(x)により、Risk A, , Cの3群に分類し、新たなリスク分類としたところ、5年PSA非再発率は、Risk A 99.3%、Risk B 95.8%、Risk C 83.5%とNCCNリスク分類よりも明確にPSA再発を予測できた。さらに、NCCN リスク分類の各リスク群を本計算式で分類することにより、各NCCNリスク群の中から、PSA再発のリスクの高い群を抽出することが可能となった。
結論
機械学習等によりPSA非再発確率を求めてリスク分類することにより、PSA非再発率をより正確に予測できる可能性が示唆された。
公開日・更新日
公開日
2020-11-02
更新日
-