大規模データの利活用研究の加速のための研究

文献情報

文献番号
202203009A
報告書区分
総括
研究課題名
大規模データの利活用研究の加速のための研究
課題番号
21AC1001
研究年度
令和4(2022)年度
研究代表者(所属機関)
木村 映善(国立大学法人愛媛大学 大学院医学系研究科)
研究分担者(所属機関)
  • 荒木 賢二(宮崎大学医学部附属病院医療情報部)
  • 黒田 知宏(国立大学法人 京都大学 医学研究科)
  • 星 佳芳(国立保健医療科学院 研究情報支援研究センター)
  • 水島 洋(国立保健医療科学院 研究情報支援研究センター)
  • 渋谷 哲朗(東京大学 医科学研究所)
  • 佐々木 香織(北海道公立大学法人札幌医科大学 医療人育成センター)
  • 長島 公之(一般財団法人日本医師会医療情報管理機構)
  • 伊藤 伸介(中央大学 経済学部)
研究区分
厚生労働科学研究費補助金 行政政策研究分野 政策科学総合研究(臨床研究等ICT基盤構築・人工知能実装研究)
研究開始年度
令和3(2021)年度
研究終了予定年度
令和4(2022)年度
研究費
10,000,000円
研究者交替、所属機関変更
-

研究報告書(概要版)

研究目的
これまで研究班は匿名加工医療情報のAIに関連した研究に関する有用性を確認した。それを踏まえて、認定事業者の利用拡大につながる施策や運用について検討を行うこととした。
研究方法
当該年度は、 (1)認定事業者にかかる意識調査、(2) 次世代医療基盤法第27条に基づくデータ融通の検討、(3) 海外の医療情報の収集・分析にかかる制度・事業の調査、(4)これまでの研究班の研究に関する広報活動を中心に行った。

(1)認定事業者にかかる意識調査
 アンケート内容は前年度までに研究班で策定した。地方自治体は一定基準以上の人口を擁し、部署の名称からリアルワールドデータを活用する可能性が伺えるものを抽出した。学術団体は医学系の学会から公開されている会員数が多いものから抽出した。これらに対してアンケート依頼文面のメール配信し、Webアンケートシステムで回答頂いた。

(2)次世代医療基盤法第27条下にかかるデータ融通の検討
 認定事業者は次世代医療基盤法第25条(2023年現在は第27条)において他の認定事業者に医療情報の提供を認められている。しかし、そのデータの名寄せ・融通の実績はなく、その運用管理の規程も未整備である。そのため、研究班と認定事業者において、データ融通に関する実証実験の実施にむけて、データ融通にかかる規程の整備案、制度設計への提言、データ突合にかかる技術的課題を洗い出すために延べ30回のWGを開催した。

(3) 海外の医療情報の収集・分析にかかる制度・事業の調査
 2022年9月に渡航し、英国で医療情報の収集、リンケージ、研究者のデータ利活用に供している組織として、NHS Digital (England)を始めとした英国の各組織を訪問し、聞き取り調査を実施した。またその聞き取り調査及び提供された資料をベースに文献調査を実施した。また、論文を執筆中に不明の点があれば、当時ヒアリングした担当者にメールで照会した。
結果と考察
<結果>
(1) 認定事業者を活用するAI研究・制度環境に関するアンケート
 全体的に次世代医療基盤法・認定事業者に対する認知度は低かった。主成分分析、順序カテゴリカル解析を通して、認定事業者の認知度の向上と認定事業者の利活用を推進するという2つの施策を推進する必要性が見いだされた。

(2)次世代医療基盤法第25条下にかかるデータ融通の検討
 複数の認定事業者にわたる申請は最初に申請を受理した認定事業者でワンストップ対応とし、その事業者が審査とリスク評価の審査結果を共有していく方向性を確認した。契約WGでは、認定事業者間の医療情報の提供に関する契約書ひな型案を完成させた。エンジニアWGでは、データ授受の形式、手段、媒体、データの統合時のクレンジングの責任分解点、文字コードの扱い等について合意を形成した。

(3) 英国の渡航調査
 英国において、匿名加工情報を研究者に提供する代わりに、Five Safe Modelsにもとづいてデータ加工、分析環境も内包したTrusted Research Environment(TRE)という運用を推進していることが確認された。本邦が学ぶべき点として、TRE、Five Safe Modelsにもとづいた運用、IndexerとLinkerの分離、利用者への教育体制の拡充が確認された。

<考察>
 認定事業者の認知度にかかるアンケートや英国の渡航調査を通して、認定事業者の認知度の向上と認定事業者の利活用を推進するという2つの施策を推進する必要性が見いだされた。英国の渡航調査を通して、改正次世代医療基盤法における仮名加工医療情報の取扱いに関して参考になる知見が得られた。特にFive Safe Modelsにもとづいた安全なデータ分析環境、利用者の認定についての運用状況は、我が国においても検討されている分析環境へのリモートアクセスや認定利用事業者に関して参考になるところ大であると思われる。
結論
改正次世代医療基盤法において仮名加工医療情報の取り扱いが議論されているが、英国におけるFive Safe ModelsやTREの運用が参考になると思われる。また、次世代医療基盤法第27条下のデータ相互融通を通してデータソースを相互にカバーすることで、データの悉皆的な入手可能性が高まっていくことも視野にいれつつ、認定事業者への認知度の向上と、利活用を推進するための支援プログラムを推進することの必要性が確認された。

公開日・更新日

公開日
2023-06-13
更新日
2024-07-17

研究報告書(PDF)

研究報告書(紙媒体)

文献情報

文献番号
202203009B
報告書区分
総合
研究課題名
大規模データの利活用研究の加速のための研究
課題番号
21AC1001
研究年度
令和4(2022)年度
研究代表者(所属機関)
木村 映善(国立大学法人愛媛大学 大学院医学系研究科)
研究分担者(所属機関)
  • 荒木 賢二(宮崎大学医学部附属病院医療情報部)
  • 黒田 知宏(国立大学法人 京都大学 医学研究科)
  • 星 佳芳(国立保健医療科学院 研究情報支援研究センター)
  • 渋谷 哲朗(東京大学 医科学研究所)
  • 佐々木 香織(北海道公立大学法人札幌医科大学 医療人育成センター)
  • 長島 公之(一般財団法人日本医師会医療情報管理機構)
  • 伊藤 伸介(中央大学 経済学部)
研究区分
厚生労働科学研究費補助金 行政政策研究分野 政策科学総合研究(臨床研究等ICT基盤構築・人工知能実装研究)
研究開始年度
令和3(2021)年度
研究終了予定年度
令和4(2022)年度
研究者交替、所属機関変更
-

研究報告書(概要版)

研究目的
平成30年に施行された次世代医療基盤法により、匿名加工された匿名加工医療情報の活用が推進されている。しかし、AIを活用した医学研究に用いられている事例はまだなかった。そこで、本研究は、認定事業者のデータ提供から解析までのプロセスを分析し、匿名加工医療情報の有用性とAI研究の技術的課題を明らかにし、研究を加速する施策の提言を目的とした。
研究方法
本研究班は、 (1)匿名加工医療情報を活用したAI研究、(2)匿名加工医療情報で機械学習する環境にかかる検討、(3)認定事業者にかかる意識調査、(4)次世代医療基盤法第27条に基づくデータ融通に向けた検討をした。
結果と考察
<結果>
(1) 認定事業者を活用するAI研究・制度環境に関するアンケート
 地方公共団体、学術団体にアンケートを実施した。全体的に次世代医療基盤法・認定事業者に対する認知度は低かった。主成分分析、順序カテゴリカル解析を通して、認定事業者の認知度の向上と認定事業者の利活用を推進するという2つの施策を推進する必要性が見いだされた。

(2) 英国の渡航調査
 英国において、匿名加工情報を研究者に提供する代わりに、Five Safe Modelsにもとづいてデータ加工、分析環境も内包したTrusted Research Environment(TRE)という運用を推進していることが確認された。本邦が学ぶべき点として、TRE、Five Safe Modelsにもとづいた運用、IndexerとLinkerの分離、利用者への教育体制の拡充が確認された。

(3) AI研究
 認定事業者の匿名加工医療情報を用いて、医療指示のシーケンス解析、敗血症の予測モデルが構築できることが確認された。また、k-匿名化と差分プライバシー双方の要求を満たす新しい匿名化手法を開発し、EMアルゴリズムと組み合わせることにより高いプライバシーレベルを保ったまま、統計量を高精度に維持できる可能性を提示した。

(4)次世代医療基盤法第25条下にかかるデータ融通の検討
複数の認定事業者にわたる申請は最初に申請を受理した認定事業者でワンストップ対応とし、その事業者が審査とリスク評価の審査結果を共有していく方向性を確認した。また、認定事業者間の医療情報の提供に関する契約書ひな型案を完成させた。データ授受の形式、手段、媒体、データの統合時のクレンジングの責任分解点、文字コードの扱い等について合意を形成した。

(5)次世代医療基盤法の認定事業者にかかる提言のまとめ
 上記の調査、研究を通して、次世代医療基盤法の認定事業者に関連して取り組むべき施策等の提言を作成した。

<考察>
 短期的視点では、認定事業者が提供する匿名加工医療情報は、学会主導で研究目的を明確に設定して収集している大規模事業と比較して差別化を図りにくい時期であると思われる。また認知度も一様に低かったため、啓発活動を継続することが重要である。長期的視点において、認定事業者の事業継続性をサポートしつつ、研究者が認定事業者を利用しやすくなる研究ファンドの開発や、後述する認定事業者の計算機環境の整備をサポートするような制度設計を検討することが必要であると思われる。
 認定事業者におけるData Visitingの運用を見据えて、現行の次世代医療基盤法やガイドラインの遵法のもと仮想環境の展開を試み、各法律やガイドラインの解釈や仮想環境の運用手法について重要な知見を蓄積した。改正次世代医療基盤法下に、認定作業事業者の管理区域内に設置された解析環境に安全にアクセスする環境の検討がなされているが、本研究班の経験からも、これらの取り組みについて早期の実現が望ましいことが確認された。
結論
機械学習に匿名加工医療情報を用いる研究テーマを実施し、全て成果発表につながった。そのうち1つは完遂できなかったが、匿名加工医療情報に帰する問題ではなく、解析環境を認定事業者に設置してオフラインで運用したことによる研究速度・進捗低下の問題である。この問題は仮名加工医療情報の概念の導入及び利用環境の整備によって解決できると考えている。総じて、本研究の範囲では匿名加工医療情報がAI技術を利用する研究に貢献することが確認された。
認定事業者を利用する研究を支援する施策の提言として、次世代医療基盤法の認知度を高める啓発活動、認定事業者に医療等情報を提供する事業者の負担軽減、認定事業者を利用した研究を支援するファンドや研究助成事業の設定、認定事業者に「信頼できる研究環境」の概念を導入しそれを支えるためのクラウド基盤の活用を積極的に支援すること、改正次世代医療基盤法に準拠した運用の早期確立への支援、相互運用性に寄与する標準規格の導入支援をすること、を提言する。

公開日・更新日

公開日
2024-07-17
更新日
-

研究報告書(PDF)

研究報告書(紙媒体)

行政効果報告

文献番号
202203009C

成果

専門的・学術的観点からの成果
特になし
臨床的観点からの成果
特になし
ガイドライン等の開発
特になし
その他行政的観点からの成果
特になし
その他のインパクト
特になし

発表件数

原著論文(和文)
0件
原著論文(英文等)
0件
その他論文(和文)
0件
その他論文(英文等)
0件
学会発表(国内学会)
0件
学会発表(国際学会等)
0件
その他成果(特許の出願)
0件
その他成果(特許の取得)
0件
その他成果(施策への反映)
0件
その他成果(普及・啓発活動)
0件

特許

主な原著論文20編(論文に厚生労働科学研究費の補助を受けたことが明記された論文に限る)

公開日・更新日

公開日
2024-07-17
更新日
-

収支報告書

文献番号
202203009Z