文献情報
文献番号
201703012A
報告書区分
総括
研究課題名
ビッグデータからの機械学習による前立腺癌小線源療法の予後予測法の開発と均てん化への応用
課題番号
H29-ICT-一般-002
研究年度
平成29(2017)年度
研究代表者(所属機関)
中村 和正(浜松医科大学 医学部)
研究分担者(所属機関)
- 斉藤 史郎(東京医療センター)
- 萬 篤憲(東京医療センター)
- 伊藤 一人(群馬大学 医学部)
- 馬込 大貴(駒沢大学 医療健康科学部)
- 小島 伸介(臨床研究情報センター)
- 菊池 隆(臨床研究情報センター)
研究区分
厚生労働科学研究費補助金 行政政策研究分野 政策科学総合研究(臨床研究等ICT基盤構築研究)
研究開始年度
平成29(2017)年度
研究終了予定年度
令和1(2019)年度
研究費
6,924,000円
研究者交替、所属機関変更
-
研究報告書(概要版)
研究目的
前立腺癌の放射線治療の予後因子としては、T因子、PSA値、Gleason分類などがある。これらによって低・中・高リスクに分類され、大まかな予後予測が可能で、それに沿ったノモグラムが作成されている。しかし、それ以外の患者背景や検査所見、照射線量、治療パラメータなどの多くの因子を網羅的に分析し、治療結果を予測する方法については国内外を含めてほとんど研究が進められていない。
我々は、ヨウ素125シード線源を用いた小線源療法に関する前向きコホート研究(JPOPS, Japanese Prostate Cancer Outcome Study of Permanent I-125 seed Implantation)を実施してきた。本研究には全国74施設(小線源療法を施行する施設の約70%)が参加し、2005年から2010年までに小線源療法で治療された約7000例(同時期に本邦で小線源療法により治療された症例の約40%)が前向き登録された。調査項目は、患者・家族背景、生活歴、T因子、PSA値、Gleason分類などの腫瘍因子、小線源治療パラメータ、外照射併用の有無等の治療因子、PSA再発の有無、生死、有害事象の有無等などで、少なくとも5年以上の経過観察が行われている世界的に類を見ないビッグデータである。2005年から2007年までのコホート1の2339例のデータクリーニングが終了し、2010年までのコホート2の約4600例についても平成28年11月で5年の経過観察が終了し、これらのビッグデータが使用可能となる予定である。
本研究は、JPOPSによって得られたビッグデータを用いて、詳細な臨床情報を機械学習させることにより、新しい前立腺癌の予後予測システムを開発することを目的とする。
我々は、ヨウ素125シード線源を用いた小線源療法に関する前向きコホート研究(JPOPS, Japanese Prostate Cancer Outcome Study of Permanent I-125 seed Implantation)を実施してきた。本研究には全国74施設(小線源療法を施行する施設の約70%)が参加し、2005年から2010年までに小線源療法で治療された約7000例(同時期に本邦で小線源療法により治療された症例の約40%)が前向き登録された。調査項目は、患者・家族背景、生活歴、T因子、PSA値、Gleason分類などの腫瘍因子、小線源治療パラメータ、外照射併用の有無等の治療因子、PSA再発の有無、生死、有害事象の有無等などで、少なくとも5年以上の経過観察が行われている世界的に類を見ないビッグデータである。2005年から2007年までのコホート1の2339例のデータクリーニングが終了し、2010年までのコホート2の約4600例についても平成28年11月で5年の経過観察が終了し、これらのビッグデータが使用可能となる予定である。
本研究は、JPOPSによって得られたビッグデータを用いて、詳細な臨床情報を機械学習させることにより、新しい前立腺癌の予後予測システムを開発することを目的とする。
研究方法
JPOPS研究のコホート1の入力項目全291個の中から、生存率、有害事象に関係のない項目を除き、機械学習に用いる解析対象項目を選別した。また、機械学習による治療成績の評価の有効姓を確認するため、60Gy以上の外部照射を施行された限局性前立腺癌の匿名化されたデータを用いて、機械学習による予後予測モデルの有用性を確認した。次に、JPOPSコホート1からの有効姓解析対象例2316例を用いて、一般的に知られている予後因子(T因子、治療前PSA値、Gleason score、照射線量、ホルモン療法の有無等が、PSA非再発率に影響するかどうかを調べた。さらに、ロジスティック回帰、サポートベクターマシン(SVM)、ランダムフォレスト(RF)、ディープラーニング(DNN)の機械学習を用いて、解析対象項目とPSA再発、有害事象の関係の解析を開始した。
結果と考察
JPOPS研究のコホート1(2005-2007年)の入力項目全291個の中から、臨床的に生存率、有害事象に関係あると考えられる項目をLimited database、その他の項目もすべて含めたLarge databaseを抽出した。
60Gy以上の外部照射を実施した679例の匿名化されたデータでは、ロジスティック回帰に比較して、SVMでは有意に予後予測精度が向上しており、機械学習による予後予測モデルの有用性を確認した。
一般的に知られている予後因子については、NCCNリスク分類、biological equivalent dose(BED)のPSA非再発率に差がなかった。ホルモン療法併用の有無では、中リスク群で、ホルモン療法併用群が有意にPSA非再発率が良好であった。前立腺体積40ml以上の群でPSA非再発率は100%と有意に良好であった。R100,R150(処方線量の100%, 150%の線量が投与された直腸容積)はGrade 2以上の消化器系晩期有害事象が見られた群で有意に高かった。
これらの解析結果を踏まえ、機械学習手法を用いて、PSA再発、有害事象発生率の予測を改善できるかを検討した。学習データではRFやDNNで予測精度が上がる傾向にあったが、テスト症例の予測精度は現時点ではいずれも低かった。今後、DNNの内部構造を工夫してさらに精度を上げる工夫を試みている。また、PSA非再発率だけではなく、臨床的再発率等と特徴量との関連も調べる予定である。また、今後、コホート2の約3600例も解析対象に加える予定で、さらに症例を増やして検討したい。
60Gy以上の外部照射を実施した679例の匿名化されたデータでは、ロジスティック回帰に比較して、SVMでは有意に予後予測精度が向上しており、機械学習による予後予測モデルの有用性を確認した。
一般的に知られている予後因子については、NCCNリスク分類、biological equivalent dose(BED)のPSA非再発率に差がなかった。ホルモン療法併用の有無では、中リスク群で、ホルモン療法併用群が有意にPSA非再発率が良好であった。前立腺体積40ml以上の群でPSA非再発率は100%と有意に良好であった。R100,R150(処方線量の100%, 150%の線量が投与された直腸容積)はGrade 2以上の消化器系晩期有害事象が見られた群で有意に高かった。
これらの解析結果を踏まえ、機械学習手法を用いて、PSA再発、有害事象発生率の予測を改善できるかを検討した。学習データではRFやDNNで予測精度が上がる傾向にあったが、テスト症例の予測精度は現時点ではいずれも低かった。今後、DNNの内部構造を工夫してさらに精度を上げる工夫を試みている。また、PSA非再発率だけではなく、臨床的再発率等と特徴量との関連も調べる予定である。また、今後、コホート2の約3600例も解析対象に加える予定で、さらに症例を増やして検討したい。
結論
JPOPSコホート2316例のデータを用いて、臨床特徴量、治療特徴量を機械学習させることにより、PSA非再発率、臨床的非再発率、全生存率、直腸および尿路有害事象発生率を推測できるかについて解析を開始した。
公開日・更新日
公開日
2018-09-12
更新日
-