文献情報
文献番号
202403006A
報告書区分
総括
研究課題名
リアルワールドデータの二次利用加速にむけた多施設データ処理方式の導入の試行研究
研究課題名(英字)
-
課題番号
23AC1003
研究年度
令和6(2024)年度
研究代表者(所属機関)
黒田 知宏(国立大学法人 京都大学 医学研究科)
研究分担者(所属機関)
- 岩尾 友秀(京都大学 医学部附属病院)
- 油谷 曉(京都大学 医学部附属病院 医療情報企画部)
- 岸本 和昌(京都大学 医学部附属病院医療情報企画部)
- 岡田 佳築(国立大学法人 大阪大学 医学部附属病院)
- 小西 正三(大阪大学 医学部附属病院)
- 青柳 吉博(国立がん研究センター東病院 医療情報部)
- 野村 恵一(国立がん研究センター 東病院 医療情報部)
- 寺尾 涼恵(国立がん研究センター 東病院 臨床研究支援部門 臨床研究推進部)
研究区分
厚生労働科学研究費補助金 行政政策研究分野 政策科学総合研究(臨床研究等ICT基盤構築・人工知能実装研究)
研究開始年度
令和5(2023)年度
研究終了予定年度
令和6(2024)年度
研究費
12,000,000円
研究者交替、所属機関変更
-
研究報告書(概要版)
研究目的
医薬品等の有効性評価に当たって、従来の臨床試験に加えて、医用情報の二次利用によるいわゆるリアルワールドデータ(以下、RWD)の利活用が期待されている。我が国では、AMED事業において、臨床研究中核病院に臨床研究に耐えうるデータベース(臨中ネット共通DB)をRWD利活用に向けた基盤として構築する「臨中ネット」の取り組みが進められてきた。本研究では、欧州で利用が開始されている、複数の医療機関からデータを半自動的に抽出、共有する仕組み「データトレイン」を臨中ネット産科病院の一部に導入・試用し、将来の全国的な導入に向けた、課題の洗い出しを行う。
研究方法
本研究では、Googleクラウドが提供するモジュールを援用することで、各医療機関の研究者がデータ提供元のリソースに接続し、効率的に分析可能な仕組みを構築する。また、患者データはダウンロードできないことをシステムで保証する。令和6年度は、令和5年度に開発・京都大学へ実装したデータ注出システムを、参加各施設へ導入し、簡単な疫学研究課題を用いたデータ注出プロセスの検証を行った。
結果と考察
試作された「データトレイン」用データ注出シスステムを、バーチャルプライベートクラウド上に実装し、3医療機関に導入した。また、ユーザが著感的にGUI操作できるデータ抽出・探索解析用のソフトウェアのインターフェイスを設計・導入した。
導入した基盤を用いて、大容量データを扱うSQLの実行テストを行い負荷試験を実施するとともに、参加医療機関から、二つの研究課題について、データ注出、及び、データ解析を試みた。その何れにおいてもテスト・注出・解析を実施することが出来た。
導入の過程で、医療機関毎に異なる詳細なセキュリティルールが導入時のSIの負担となることが見出されたが、一方で、同一クラウド、クラウド間接続、オンプレとクラウドの接続の三種類の形式で接続が実現された。
また、多層の実装によって、特に遅い処理や機関があると、タイムアウトが頻発して処理実行が難しくなることが確認された。
最後に、実際の運用に際しては、データ注出だけでなく、全ての処理を環境上で実施する方が効率が高くなることが示唆された。これを実現するには、RWDの集計処理の三類型、(1)選択処理のない単一ファイル処理(2)選択処理のある単一ファイル処理(3)複数ファイルへアクセスする処理、のそれぞれに対応する実施環境とUIの整備が必要であると考えられた。
本研究の結果から、クラウド技術を活用することで、データの移動などの「漏洩」の危険を伴わずにデータ処理を行う条オフ処理基盤が実現され、それを用いて充分疫学研究が実施可能であろうことが示された。
導入した基盤を用いて、大容量データを扱うSQLの実行テストを行い負荷試験を実施するとともに、参加医療機関から、二つの研究課題について、データ注出、及び、データ解析を試みた。その何れにおいてもテスト・注出・解析を実施することが出来た。
導入の過程で、医療機関毎に異なる詳細なセキュリティルールが導入時のSIの負担となることが見出されたが、一方で、同一クラウド、クラウド間接続、オンプレとクラウドの接続の三種類の形式で接続が実現された。
また、多層の実装によって、特に遅い処理や機関があると、タイムアウトが頻発して処理実行が難しくなることが確認された。
最後に、実際の運用に際しては、データ注出だけでなく、全ての処理を環境上で実施する方が効率が高くなることが示唆された。これを実現するには、RWDの集計処理の三類型、(1)選択処理のない単一ファイル処理(2)選択処理のある単一ファイル処理(3)複数ファイルへアクセスする処理、のそれぞれに対応する実施環境とUIの整備が必要であると考えられた。
本研究の結果から、クラウド技術を活用することで、データの移動などの「漏洩」の危険を伴わずにデータ処理を行う条オフ処理基盤が実現され、それを用いて充分疫学研究が実施可能であろうことが示された。
結論
本研究では、複数機関においてクラウドシステム上でデータを解析するというわが国では類を見ない取り組みを実施した。開発したクラウドシステムは、各機関への接続方法やデータ抽出において様々課題は見つかったが、データの移動を伴わない「漏洩リスクの少ない」処理系が簡便に実現されることが示された。今後複数機関でデータ共有、解析を実施するようなシステムを開発する際の端緒となることが期待される。
公開日・更新日
公開日
2025-06-20
更新日
-