リアルワールドデータの二次利用加速にむけた多施設データ処理方式の導入の試行研究

文献情報

文献番号
202403006A
報告書区分
総括
研究課題名
リアルワールドデータの二次利用加速にむけた多施設データ処理方式の導入の試行研究
研究課題名(英字)
-
課題番号
23AC1003
研究年度
令和6(2024)年度
研究代表者(所属機関)
黒田 知宏(国立大学法人 京都大学 医学研究科)
研究分担者(所属機関)
  • 岩尾 友秀(京都大学 医学部附属病院)
  • 油谷 曉(京都大学 医学部附属病院 医療情報企画部)
  • 岸本 和昌(京都大学 医学部附属病院医療情報企画部)
  • 岡田 佳築(国立大学法人 大阪大学 医学部附属病院)
  • 小西 正三(大阪大学 医学部附属病院)
  • 青柳 吉博(国立がん研究センター東病院 医療情報部)
  • 野村 恵一(国立がん研究センター 東病院 医療情報部)
  • 寺尾 涼恵(国立がん研究センター 東病院 臨床研究支援部門 臨床研究推進部)
研究区分
厚生労働科学研究費補助金 行政政策研究分野 政策科学総合研究(臨床研究等ICT基盤構築・人工知能実装研究)
研究開始年度
令和5(2023)年度
研究終了予定年度
令和6(2024)年度
研究費
12,000,000円
研究者交替、所属機関変更
-

研究報告書(概要版)

研究目的
医薬品等の有効性評価に当たって、従来の臨床試験に加えて、医用情報の二次利用によるいわゆるリアルワールドデータ(以下、RWD)の利活用が期待されている。我が国では、AMED事業において、臨床研究中核病院に臨床研究に耐えうるデータベース(臨中ネット共通DB)をRWD利活用に向けた基盤として構築する「臨中ネット」の取り組みが進められてきた。本研究では、欧州で利用が開始されている、複数の医療機関からデータを半自動的に抽出、共有する仕組み「データトレイン」を臨中ネット産科病院の一部に導入・試用し、将来の全国的な導入に向けた、課題の洗い出しを行う。
研究方法
本研究では、Googleクラウドが提供するモジュールを援用することで、各医療機関の研究者がデータ提供元のリソースに接続し、効率的に分析可能な仕組みを構築する。また、患者データはダウンロードできないことをシステムで保証する。令和6年度は、令和5年度に開発・京都大学へ実装したデータ注出システムを、参加各施設へ導入し、簡単な疫学研究課題を用いたデータ注出プロセスの検証を行った。
結果と考察
試作された「データトレイン」用データ注出シスステムを、バーチャルプライベートクラウド上に実装し、3医療機関に導入した。また、ユーザが著感的にGUI操作できるデータ抽出・探索解析用のソフトウェアのインターフェイスを設計・導入した。
 導入した基盤を用いて、大容量データを扱うSQLの実行テストを行い負荷試験を実施するとともに、参加医療機関から、二つの研究課題について、データ注出、及び、データ解析を試みた。その何れにおいてもテスト・注出・解析を実施することが出来た。
 導入の過程で、医療機関毎に異なる詳細なセキュリティルールが導入時のSIの負担となることが見出されたが、一方で、同一クラウド、クラウド間接続、オンプレとクラウドの接続の三種類の形式で接続が実現された。
 また、多層の実装によって、特に遅い処理や機関があると、タイムアウトが頻発して処理実行が難しくなることが確認された。
 最後に、実際の運用に際しては、データ注出だけでなく、全ての処理を環境上で実施する方が効率が高くなることが示唆された。これを実現するには、RWDの集計処理の三類型、(1)選択処理のない単一ファイル処理(2)選択処理のある単一ファイル処理(3)複数ファイルへアクセスする処理、のそれぞれに対応する実施環境とUIの整備が必要であると考えられた。
 本研究の結果から、クラウド技術を活用することで、データの移動などの「漏洩」の危険を伴わずにデータ処理を行う条オフ処理基盤が実現され、それを用いて充分疫学研究が実施可能であろうことが示された。
結論
本研究では、複数機関においてクラウドシステム上でデータを解析するというわが国では類を見ない取り組みを実施した。開発したクラウドシステムは、各機関への接続方法やデータ抽出において様々課題は見つかったが、データの移動を伴わない「漏洩リスクの少ない」処理系が簡便に実現されることが示された。今後複数機関でデータ共有、解析を実施するようなシステムを開発する際の端緒となることが期待される。

公開日・更新日

公開日
2025-06-20
更新日
-

研究報告書(PDF)

公開日・更新日

公開日
2025-06-20
更新日
-

文献情報

文献番号
202403006B
報告書区分
総合
研究課題名
リアルワールドデータの二次利用加速にむけた多施設データ処理方式の導入の試行研究
研究課題名(英字)
-
課題番号
23AC1003
研究年度
令和6(2024)年度
研究代表者(所属機関)
黒田 知宏(国立大学法人 京都大学 医学研究科)
研究分担者(所属機関)
  • 岩尾 友秀(京都大学 医学部附属病院)
  • 油谷 曉(京都大学 医学部附属病院 医療情報企画部)
  • 岸本 和昌(京都大学 医学部附属病院医療情報企画部)
  • 岡田 佳築(国立大学法人 大阪大学 医学部附属病院)
  • 小西 正三(大阪大学 医学部附属病院)
  • 青柳 吉博(国立がん研究センター東病院 医療情報部)
  • 野村 恵一(国立がん研究センター 東病院 医療情報部)
  • 寺尾 涼恵(国立がん研究センター 東病院 臨床研究支援部門 臨床研究推進部)
研究区分
厚生労働科学研究費補助金 行政政策研究分野 政策科学総合研究(臨床研究等ICT基盤構築・人工知能実装研究)
研究開始年度
令和5(2023)年度
研究終了予定年度
令和6(2024)年度
研究者交替、所属機関変更
-

研究報告書(概要版)

研究目的
医薬品等の有効性評価に当たって、従来の臨床試験に加えて、医用情報の二次利用によるいわゆるリアルワールドデータ(以下、RWD)の利活用が期待されている。我が国では、AMED事業において、臨床研究中核病院に臨床研究に耐えうるデータベース(臨中ネット共通DB)をRWD利活用に向けた基盤として構築する「臨中ネット」の取り組みが進められてきた。本研究では、欧州で利用が開始されている、複数の医療機関からデータを半自動的に抽出、共有する仕組み「データトレイン」を臨中ネット産科病院の一部に導入・試用し、将来の全国的な導入に向けた、課題の洗い出しを行う。
研究方法
本研究では、Googleクラウドが提供するモジュールを援用することで、各医療機関の研究者がデータ提供元のリソースに接続し、効率的に分析可能な仕組みを構築する。また、患者データはダウンロードできないことをシステムで保証する。具体的胃は、令和5年度にデータ注出システムの実装を、令和6年度に参加各施設への導入と簡単な疫学研究課題を用いたデータ注出プロセスの検証を行った。
結果と考察
試作された「データトレイン」用データ注出シスステムを、バーチャルプライベートクラウド上に実装し、3医療機関に導入した。また、ユーザが著感的にGUI操作できるデータ抽出・探索解析用のソフトウェアのインターフェイスを設計・導入した。
 導入した基盤を用いて、大容量データを扱うSQLの実行テストを行い負荷試験を実施するとともに、参加医療機関から、二つの研究課題について、データ注出、及び、データ解析を試みた。その何れにおいてもテスト・注出・解析を実施することが出来た。
 導入の過程で、医療機関毎に異なる詳細なセキュリティルールが導入時のSIの負担となることが見出されたが、一方で、同一クラウド、クラウド間接続、オンプレとクラウドの接続の三種類の形式で接続が実現された。
 また、多層の実装によって、特に遅い処理や機関があると、タイムアウトが頻発して処理実行が難しくなることが確認された。
 最後に、実際の運用に際しては、データ注出だけでなく、全ての処理を環境上で実施する方が効率が高くなることが示唆された。これを実現するには、RWDの集計処理の三類型、(1)選択処理のない単一ファイル処理(2)選択処理のある単一ファイル処理(3)複数ファイルへアクセスする処理、のそれぞれに対応する実施環境とUIの整備が必要であると考えられた。
 本研究の結果から、クラウド技術を活用することで、データの移動などの「漏洩」の危険を伴わずにデータ処理を行う条オフ処理基盤が実現され、それを用いて充分疫学研究が実施可能であろうことが示された。
結論
本研究では、複数機関においてクラウドシステム上でデータを解析するというわが国では類を見ない取り組みを実施した。開発したクラウドシステムは、各機関への接続方法やデータ抽出において様々課題は見つかったが、データの移動を伴わない「漏洩リスクの少ない」処理系が簡便に実現されることが示された。今後複数機関でデータ共有、解析を実施するようなシステムを開発する際の端緒となることが期待される。

公開日・更新日

公開日
2025-06-20
更新日
-

研究報告書(PDF)

公開日・更新日

公開日
2025-06-20
更新日
-

行政効果報告

文献番号
202403006C

成果

専門的・学術的観点からの成果
各医療機関に設置された共通形式のデータベースからデータを移動させることなく半自動で注出・共有・集計出来る情報基盤「データトレイン」を、臨床研究中核病院のリアルワールドデータ(RWD)情報基盤「臨中ネット」に導入した。本研究の成果から、オンプレミス,クラウド間接続,同一クラウド内接続の電子カルテとの接続の全ての形態を結ぶフェデレーション型RWD分析環境が実現可能であることが示された。
臨床的観点からの成果
診療現場で発生した医療データの臨床研究への活用を活性化するには、究極の個人情報たる医療データの漏洩の可能性を低くしつつ、高い自由度でデータ分析出来る環境が望まれる。本研究の成果により、データそのものを移動することなく、「データ注出・分析アルゴリズム」を「コンテナ」に詰め込んで、多施設のデータベース間を移動しながら集計・分析が可能な「データトレイン」を、あらゆる形態の電子カルテ基盤で実現可能であることが確認されたことで、安全なRWD研究基盤の整備の可能性が見出された。
ガイドライン等の開発
(該当無し)
その他行政的観点からの成果
現在、我が国におけるリアルワールドデータ(RWD)を活用した後ろ向き臨床研究の活性化を図るべく、全ての臨床研究中核病院に同一形式のデータベースを設置し、広く国内外の研究者に使ってもらえるようにする、「臨中ネット」事業が実施されている。本研究の成果によって、全ての医療機関にデータ提供を実施する作業者を置かずとも安全・確実に臨床研究を実施できる基盤整備の方法が明確になり、臨床研究中核病院の質の高い医療RWDを全国民的に活用できる可能性が高まった。
その他のインパクト
本研究の成果は、「臨中ネット」事業の成果の一部として、活用が検討されることとなる。

発表件数

原著論文(和文)
0件
原著論文(英文等)
0件
その他論文(和文)
0件
その他論文(英文等)
0件
学会発表(国内学会)
0件
学会発表(国際学会等)
0件
その他成果(特許の出願)
0件
その他成果(特許の取得)
0件
その他成果(施策への反映)
0件
その他成果(普及・啓発活動)
0件

特許

主な原著論文20編(論文に厚生労働科学研究費の補助を受けたことが明記された論文に限る)

公開日・更新日

公開日
2025-10-14
更新日
-

収支報告書

文献番号
202403006Z
報告年月日

収入

(1)補助金交付額
15,600,000円
(2)補助金確定額
14,465,000円
差引額 [(1)-(2)]
1,135,000円

支出

研究費 (内訳) 直接研究費 物品費 1,132,537円
人件費・謝金 0円
旅費 1,030,355円
その他 8,702,693円
間接経費 3,600,000円
合計 14,465,585円

備考

備考
-

公開日・更新日

公開日
2025-09-11
更新日
-