大規模データの利活用研究の加速のための研究

文献情報

文献番号
202103010A
報告書区分
総括
研究課題名
大規模データの利活用研究の加速のための研究
研究課題名(英字)
-
課題番号
21AC1001
研究年度
令和3(2021)年度
研究代表者(所属機関)
木村 映善(国立大学法人愛媛大学 大学院医学系研究科)
研究分担者(所属機関)
  • 荒木 賢二(宮崎大学医学部附属病院医療情報部)
  • 黒田 知宏(国立大学法人 京都大学 医学研究科)
  • 水島 洋(国立保健医療科学院 研究情報支援研究センター)
  • 星 佳芳(国立保健医療科学院 研究情報支援研究センター)
  • 渋谷 哲朗(東京大学 医科学研究所)
  • 佐々木 香織(北海道公立大学法人札幌医科大学 医療人育成センター)
  • 長島 公之(一般財団法人日本医師会医療情報管理機構)
  • 伊藤 伸介(中央大学 経済学部)
研究区分
厚生労働科学研究費補助金 行政政策研究分野 政策科学総合研究(臨床研究等ICT基盤構築・人工知能実装研究)
研究開始年度
令和3(2021)年度
研究終了予定年度
令和4(2022)年度
研究費
10,000,000円
研究者交替、所属機関変更
-

研究報告書(概要版)

研究目的
健康医療ビッグデータをこれまでの統計解析手法に加えてAIを適用させることにより、これまでに省みられることのなかった事象に光をあて、医療の質の向上・均てん化・診療支援と医療分野のイノベーションに貢献することが期待されている。このため、要配慮個人情報を収集し、匿名加工された医療情報を円滑に利活用する社会的仕組みとして、医療分野の研究開発に資するための次世代医療基盤法が施行された。この次世代医療基盤法の認定事業者から匿名加工医療情報を提供頂いてICT・AI技術を利用した研究や開発が進展することが期待されている。
 しかし、認定事業者は稼働したばかりであり、医学研究に用いられている事例はまだない。また、機械学習手法は多数の変数を要求する傾向がありながら、匿名加工による変数削減とリスクのトレードオフの関係下に変数の数に制約を課せられる可能性があることから、匿名加工医療情報を用いた機械学習の研究について懐疑的な見方もでている。そこで、本研究では実際の認定事業者へのデータ提供依頼に始まり、研究者の研究体制への審査・監査・匿名加工医療情報の解析までを通した密着取材的なプロセス分析を通した有用性等を検証することにより、匿名加工医療情報がどのような研究に資するのか、またAI技術を用いた研究に関する技術的課題を明らかにし、認定事業者を利用した研究を加速する施策の提言につなげることを目的とする。
研究方法
 次世代医療基盤法の認定事業者の匿名加工医療情報を活用したAIに係る研究のために、第1号業者一般社団法人ライフデータイニシアティブ(LDI)、第2号業者一般財団法人日本医師会医療情報管理機構(J-MIMO)へ利用申請を行い、各々において匿名加工医療情報の利用の承認を得る。
 AIにかかる研究に匿名加工医療情報を提供する際には、多くの変数が要求されること、利活用者の情報セキュリティ環境を考慮して、匿名加工の加工基準が高いものに設定され、匿名加工医療情報のデータの質に制約が加えられる可能性がある。そのため、外部への提供ではなく、認定事業者の安全な環境下のみに利用を限定することで匿名加工の加工基準を引き下げ、AIの研究に必要な多種多様な変数が含まれる状態を担保することが期待される。LDIから提供される匿名加工医療情報を活用した3種類の研究を認定事業者内にて安全に実施する方法論を検討する。
 また、各認定事業者へデータ保有状況、保有データ種に関する状況についてヒアリングを実施し、認定事業者を活用するAI研究・制度環境に関するアンケート案を班会議にて策定する。
結果と考察
 現在、認定事業者を利用した研究は4テーマで行われており、それぞれの研究は終了後に研究論文として発表予定である。合成データの研究では、プロトタイプ的評価として、愛媛大学のDPCデータを使用し、ベイジアンネットワーク、CTGAN、岡田らによる統計量ベース(STAT)によるデータ合成手法の比較を行い、合成データの品質を評価した。中間結果として、差分プライバシーを適用した場合に合成データの誤差が拡大する傾向が確認され、元データの分布状況に誤差の発生状況が左右されることが確認された。J-MIMOにおいては、検討の過程において、差分プライバシーの分析は個人の識別特定にかかる活動に相当しないという整理がなされた。第2号事業者の主なデータソースは全てSS-MIX標準化ストレージであり、SS-MIX内に格納されているHL7 2.xメッセージの各項目をレビューし、分析対象となるデータ項目及び匿名加工医療情報の匿名加工の基準に関する方針について決定した。東京大学への匿名加工医療情報を提供頂いて、年度末から研究分担者による分析が開始されている。
結論
 当初の予定では、第3号事業者あるいは第1号事業者の医用画像収集事業の開始を想定していたが、いずれも実現せず、次世代医療基盤法第25条下のデータの名寄せと融通に掛かる検討に切り替えた以外は全体としての研究遂行は予定通りに進行している。通常の匿名加工医療情報の提供プロセスに加えて、匿名加工医療情報で機械学習する環境にかかる検討を入れたため、契約までに時間を要したが、結果的には各事業者の協力により、4種類のAIにかかる研究を実施できており、当初の想定より研究範囲が広がっている。来年度より、認定事業者の潜在的利用者へのアンケート、海外事例の調査、次世代医療基盤法第25条下のデータ融通の検討も加わり、最終的に認定事業者にかかる厚生労働省行政の有意義な提言につながることが期待される。

公開日・更新日

公開日
2025-05-02
更新日
-

研究報告書(PDF)

公開日・更新日

公開日
2022-06-06
更新日
-

研究報告書(紙媒体)

収支報告書

文献番号
202103010Z
報告年月日

収入

(1)補助金交付額
13,000,000円
(2)補助金確定額
13,000,000円
差引額 [(1)-(2)]
0円

支出

研究費 (内訳) 直接研究費 物品費 1,200,000円
人件費・謝金 0円
旅費 0円
その他 8,800,000円
間接経費 3,000,000円
合計 13,000,000円

備考

備考
-

公開日・更新日

公開日
2025-04-30
更新日
-