ビッグデータからの機械学習による前立腺癌小線源療法の予後予測法の開発と均てん化への応用

文献情報

文献番号
201903002A
報告書区分
総括
研究課題名
ビッグデータからの機械学習による前立腺癌小線源療法の予後予測法の開発と均てん化への応用
課題番号
H29-ICT-一般-002
研究年度
令和1(2019)年度
研究代表者(所属機関)
中村 和正(浜松医科大学 医学部)
研究分担者(所属機関)
  • 斉藤 史郎(東京医療センター 泌尿器科)
  • 萬 篤憲(東京医療センター 放射線科)
  • 片山 敬久(岡山大学 大学院)
  • 馬込 大貴(駒沢大学 医療健康科学部)
  • 小島 伸介(医療イノベーション推進センター 医療研究開発本部)
  • 菊池 隆(医療イノベーション推進センター データサイエンス研究本部)
研究区分
厚生労働科学研究費補助金 行政政策研究分野 政策科学総合研究(臨床研究等ICT基盤構築・人工知能実装研究)
研究開始年度
平成29(2017)年度
研究終了予定年度
令和1(2019)年度
研究費
6,924,000円
研究者交替、所属機関変更
-

研究報告書(概要版)

研究目的
我々は、ヨウ素125シード線源を用いた小線源療法に関する前向きコホート研究(JPOPS, Japanese Prostate Cancer Outcome Study of Permanent I-125 seed Implantation)を実施してきた。本研究には全国74施設(小線源療法を施行する施設の約70%)が参加し、2005年から2010年までに小線源療法で治療された約7000例が前向き登録された。
 本研究の目的は、JPOPSによって得られたビッグデータを用いて、詳細な臨床情報を機械学習させることにより、新しい前立腺癌の予後予測システムを開発し、放射線治療の質の均てん化に資することである。
研究方法
1) J-POPSコホート1, 2全症例での治療成績の解析
J-POPSコホート2の約4600例(2008-2010年)のデータの仮クリーニングが終了し、J-POPSコホート1, 2を合わせた約7000例にて治療成績を解析した。
2)JPOPSコホート1、2での機械学習による予後予測精度向上の検証
POPSコホート1、2の約7000例のデータを用いて、ロジスティック回帰、サポートベクターマシン(SVM)、ランダムフォレスト(RF)、ディープラーニング(DNN)の機械学習手法を用いて、PSA再発、有害事象発生率の予測を改善できるかを検討した。入力特徴量は、特徴量を4つまたは7つに厳選した場合となるべく多くの特徴量を採用したLarge Database(44項目)のデータセットを用いた。評価法は10-fold cross- validation法を用いた。
3)新しい基準でのPSA非再発率と予後因子との関係
 PSA非再発率と予後因子との関係を評価するために、Gleason分類、T因子、PSA値、BEDのみの4つの因子を用いて、回帰係数より、各々の症例でのPSA非再発確率 p(x)を求め、PSA非再発確率p(x)により、リスク分類を行い、PSA非再発率を求めた。
結果と考察
1)J-POPSコホート1, 2全症例での治療成績の解析
 J-POPSコホート1, 2の6430例を対象とし、経過観察期間の中央値5.00 年(0.07-10.8 年)にて、原病死 13例、他病死 167例であった。5年PSA非再発率は、低リスク群98.3%、中リスク群95.2%、高リスク群90.8%で、リスクが上がるほど有意にPSA非再発率が低かった(P < 0.001)。
2)JPOPSコホート1、2での機械学習による予後予測精度向上の検証
コホート1, 2の6430例のビッグデータを用いて、ロジスティック回帰、SVM、RF、DNNの機械学習手法を用いて、PSA再発の予測を改善できるかを検討した。いずれも学習データでは予測精度は0.65 - 0.9以上と高い値を示したが、テスト症例の予測精度は低かった。特に、Precision、すなわち再発と予測した症例のうち、真に再発した症例の割合はいずれも0.15以下であった。これは、「再発する」と機械学習で予測しても、15%以下の精度しかないことを意味する。前立腺癌小線源療法においては、JPOPSで取得されたデータのみでは、機械学習を用いても正確に再発するかどうかを予測することは困難であることが判明した。その原因として、前立腺癌小線源療法では、PSA再発の頻度が極めて少ないこと、および、今回のJPOPSで収集したデータ以外の因子、例えば腫瘍の遺伝子情報、患者の生活習慣等が再発に係わっている可能性があること、の2つを考えている。
3)新しい基準でのPSA非再発率と予後因子との関係
平成30年度に得られた、新しい予後分類を用いることとした。ロジスティック回帰分析にて有意であったGleasonスコア、T因子、PSA値、Total BEDの4つの因子にて、回帰係数より、各々の症例でのPSA非再発確率 p(x)を求め、PSA非再発確率p(x)により、Risk A, , Cの3群に分類し、新たなリスク分類としたところ、5年PSA非再発率は、Risk A 99.3%、Risk B 95.8%、Risk C 83.5%とNCCNリスク分類よりも明確にPSA再発を予測できた。さらに、NCCN リスク分類の各リスク群を本計算式で分類することにより、各NCCNリスク群の中から、PSA再発のリスクの高い群を抽出することが可能となった。
結論
機械学習等によりPSA非再発確率を求めてリスク分類することにより、PSA非再発率をより正確に予測できる可能性が示唆された。

公開日・更新日

公開日
2020-11-02
更新日
-

研究報告書(PDF)

公開日・更新日

公開日
2020-11-02
更新日
-

研究報告書(紙媒体)

文献情報

文献番号
201903002B
報告書区分
総合
研究課題名
ビッグデータからの機械学習による前立腺癌小線源療法の予後予測法の開発と均てん化への応用
課題番号
H29-ICT-一般-002
研究年度
令和1(2019)年度
研究代表者(所属機関)
中村 和正(浜松医科大学 医学部)
研究分担者(所属機関)
  • 斉藤 史郎(東京医療センター 泌尿器科)
  • 萬 篤憲(東京医療センター 放射線科)
  • 伊藤 一人(群馬大学 大学院)
  • 馬込 大貴(駒沢大学 医療健康科学部)
  • 小島 伸介(医療イノベーション推進センター 医療研究開発本部)
  • 菊池 隆(医療イノベーション推進センター データサイエンス研究本部)
  • 片山 敬久(岡山大学 大学院)
研究区分
厚生労働科学研究費補助金 行政政策研究分野 政策科学総合研究(臨床研究等ICT基盤構築・人工知能実装研究)
研究開始年度
平成29(2017)年度
研究終了予定年度
令和1(2019)年度
研究者交替、所属機関変更
-

研究報告書(概要版)

研究目的
我々は、ヨウ素125シード線源を用いた小線源療法に関する前向きコホート研究(JPOPS, Japanese Prostate Cancer Outcome Study of Permanent I-125 seed Implantation)を実施してきた。本研究には全国74施設(小線源療法を施行する施設の約70%)が参加し、2005年から2010年までに小線源療法で治療された約7000例が前向き登録された。
 本研究の目的は、JPOPSによって得られたビッグデータを用いて、詳細な臨床情報を機械学習させることにより、新しい前立腺癌の予後予測システムを開発し、放射線治療の質の均てん化に資することである。
研究方法
1)放射線治療施設の規模と治療の質
 先進国における放射線治療施設数、外部照射機器数との関係を調べた。次に、J-POPSコホート1に120例以上登録している大規模5施設と、120例未満を登録した20施設について、施設規模と治療パラメータとの関係を調べた。
2) J-POPSコホート1, 2全症例での治療成績の解析
J-POPSコホート1, 2を合わせた約7000例にて治療成績を解析した。
3)機械学習による予後予測精度向上の検証
POPSコホート1、2の約7000例のデータを用いて、ロジスティック回帰、サポートベクターマシン(SVM)、ランダムフォレスト(RF)、ディープラーニング(DNN)の機械学習手法を用いて、PSA再発、有害事象発生率の予測を改善できるかを検討した。入力特徴量は、特徴量を厳選した場合となるべく多くの特徴量を採用したLarge Database(44項目)の2つのデータセットを用いた。
4)新しい基準でのPSA非再発率と予後因子との関係
 PSA非再発率と予後因子との関係を評価するために、Gleason分類、T因子、PSA値、BEDのみの4つの因子を用いて、回帰係数より、各々の症例でのPSA非再発確率を求め、PSA非再発確率により、リスク分類を行い、PSA非再発率を求めた。
結果と考察
1)放射線治療施設の規模と治療の質
本邦では放射線治療施設数当たりの外部照射装置数は1.24と先進国中で最も小さかった。また施設当たり3台以上の外部照射数を持つ大規模施設の割合も最も少なく、放射線施設が分散していることが明らかとなった。次に、120例以上登録している大規模5施設と120例未満を登録した20施設にて、小線源単独症例の治療パラメータを比較したところ、大規模施設にて良好となる傾向にあった。
2)J-POPSコホート1, 2全症例での治療成績の解析
 経過観察期間の中央値5.00 年(0.07-10.8 年)にて、原病死 13例、他病死 167例であった。5年PSA非再発率は、低リスク群98.3%、中リスク群95.2%、高リスク群90.8%で、リスクが上がるほど有意にPSA非再発率が低かった(P < 0.001)。
3)JPOPSコホート1、2での機械学習による予後予測精度向上の検証
6430例のビッグデータを用いて、機械学習手法を用いて、PSA再発の予測を改善できるかを検討した。いずれも学習データでは予測精度は0.65 - 0.9以上と高い値を示したが、テスト症例の予測精度は低かった。特に、Precision、すなわち再発と予測した症例のうち、真に再発した症例の割合はいずれも0.15以下であった。前立腺癌小線源療法では、PSA再発の頻度が極めて少ないため、機械学習では予測が難しいことが判明した。
4)新しい基準でのPSA非再発率と予後因子との関係
ロジスティック回帰分析にて有意であったGleasonスコア、T因子、PSA値、Total BEDの4つの因子にて、回帰係数より、各々の症例でのPSA非再発確率を求め、PSA非再発確率により、Risk A, B, Cの3群に分類し、新たなリスク分類としたところ、5年PSA非再発率は、Risk A 99.3%、Risk B 95.8%、Risk C 83.5%とNCCNリスク分類よりも明確にPSA再発を予測できた。さらに、NCCN リスク分類の各リスク群を本計算式で分類することにより、各NCCNリスク群の中から、PSA再発のリスクの高い群を抽出することが可能となった。
結論
機械学習等によりPSA非再発確率を求めてリスク分類することにより、PSA非再発率をより正確に予測できる可能性が示唆された。また、放射線治療施設の規模と治療の質小線源単独症例の治療パラメータを比較したところ、大規模施設にて良好となる傾向にあった。

公開日・更新日

公開日
2020-11-02
更新日
-

研究報告書(PDF)

公開日・更新日

公開日
2020-11-02
更新日
-

研究報告書(紙媒体)

行政効果報告

文献番号
201903002C

収支報告書

文献番号
201903002Z
報告年月日

収入

(1)補助金交付額
9,000,000円
(2)補助金確定額
9,000,000円
差引額 [(1)-(2)]
0円

支出

研究費 (内訳) 直接研究費 物品費 3,380,978円
人件費・謝金 368,744円
旅費 1,590,041円
その他 1,584,239円
間接経費 2,076,000円
合計 9,000,002円

備考

備考
研究費が2円ほどオーバーした。2円は自己資金で補充した。

公開日・更新日

公開日
2023-05-25
更新日
-