文献情報
文献番号
202406010A
報告書区分
総括
研究課題名
NDB研究支援体制の実践的検証研究
研究課題名(英字)
-
課題番号
24CA2010
研究年度
令和6(2024)年度
研究代表者(所属機関)
村松 圭司(産業医科大学 医学部 公衆衛生学)
研究分担者(所属機関)
- 森 由希子(国立大学法人 京都大学 医学部附属病院 医療情報企画部)
- 明神 大也(浜松医科大学 医学部 健康社会医学講座)
- 牧戸 香詠子(東京大学 大学院医学系研究科生物統計情報学講座)
研究区分
厚生労働行政推進調査事業費補助金 行政政策研究分野 厚生労働科学特別研究
研究開始年度
令和6(2024)年度
研究終了予定年度
令和6(2024)年度
研究費
5,440,000円
研究者交替、所属機関変更
-
研究報告書(概要版)
研究目的
NDB「通年パネルデータセット」をクラウド解析基盤HIC上で一気通貫で実施し、迅速提供体制と研究支援サービスの実効性を研究者・提供者双方の視点から検証する。具体的には、①オンライン申請手続とHIC仮想環境の操作性を評価しデータ利用開始までの期間短縮の可否を明らかにする、②全テーブル・カラムの記述統計自動生成と技術的ボトルネック対策を行う、③HICポータルの実地運用を通じて運用上の課題を可視化し改善策を提案する、④海外サンプルデータセット提供実態の比較調査から日本版サンプル拡充等の指針を提示する。これらを通じ、NDB利活用の障壁低減と医療政策立案・臨床疫学研究の加速に資する実践的エビデンス創出を目指す。
研究方法
NDB 実地運用では、2022 年度分全データを対象に利用申請し、事前相談開始から143 日、審査承諾から 45 日で接続を完了。CSV(NK 約130 GB、ZK 約220 GB)を PostgreSQL に取り込み(NK 9営業日、ZK 3営業日)、PowerShell でDB 操作を行いテンプレート化した。
探索的データ解析では、全テーブル・カラムの記述統計を自動集計し、データディクショナリ兼クエリ雛形として再利用可能にした。
HIC ポータル運用課題解析では、ユーザー登録や申請等を実施し、操作性、一時保存機能、通知フロー等の課題を抽出。質問機能の区分不明瞭さや回答状況を記録し改善提案を整理した。
海外事例比較調査では、台湾 NHIRD、韓国 NHIS、英国 CPRD を対象に文献レビューとヒアリングで抽出設計、アクセス条件等を比較した。
研究支援フィードバックとして、DB 操作者等から聞き取り、「PowerShell 操作への不慣れ」「診療報酬マスタ整備不足」を課題とし、解決策を評価した。 これにより、HIC 迅速提供プロセスの所要時間、仮想環境性能、支援資材、ポータル UI/ガバナンス、海外事例との比較指標を包括的に取得した。
探索的データ解析では、全テーブル・カラムの記述統計を自動集計し、データディクショナリ兼クエリ雛形として再利用可能にした。
HIC ポータル運用課題解析では、ユーザー登録や申請等を実施し、操作性、一時保存機能、通知フロー等の課題を抽出。質問機能の区分不明瞭さや回答状況を記録し改善提案を整理した。
海外事例比較調査では、台湾 NHIRD、韓国 NHIS、英国 CPRD を対象に文献レビューとヒアリングで抽出設計、アクセス条件等を比較した。
研究支援フィードバックとして、DB 操作者等から聞き取り、「PowerShell 操作への不慣れ」「診療報酬マスタ整備不足」を課題とし、解決策を評価した。 これにより、HIC 迅速提供プロセスの所要時間、仮想環境性能、支援資材、ポータル UI/ガバナンス、海外事例との比較指標を包括的に取得した。
結果と考察
通年パネルデータセット取得・処理は、厚労省承諾後45 日でHIC解析環境へ接続完了した。DB化はNK 9営業日、ZK 3営業日で、テンプレートとマニュアルが時間短縮に寄与した。この利用開始までの期間は従来の特別抽出に比して半期以上の短縮であり、申請手続と仮想環境性能の実効性を示した。
網羅的記述統計・テンプレート整備では、全テーブル・カラムの記述統計自動抽出によりデータディクショナリとSQL雛形を生成し、初学者の変数探索効率化を確認した。ER図と推奨手順も整理。クラウド環境での複数拠点同時操作はメリットであった。これらの共有は協働研究を促進する。
HICポータル運用評価では、オンライン申請で複数施設入力不可や一時保存不可等の構造的制約、掲示板・メッセージの使い分け周知不足、ユーザー登録の遅延が判明。改善策として複数施設入力フィールド追加、下書き保存機能、質問自動分類アルゴリズム導入を提案した。特に掲示板質問の回答主体分散はタグ付けルーティングが有効とした。
解析環境の課題としてPowerShell操作不慣れと診療報酬マスタ欠落が挙がったが、FAQ・サンプルスクリプト、マスタ共有機能で解決可能と評価。マニュアル形式・配置、緊急メンテナンスの影響も報告された。CSV→DB化はPowerShell操作とマスタ整備に依存し、これら支援の常設化が重要である。
海外追跡サンプルとの比較では、台湾NHIRD(大規模サンプル、オンサイト)、韓国NHIS(OPEN COHORT、リモート可)、英国CPRD(長期縦断、年額ライセンス制)を調査。日本版は全量データで網羅性が高い一方、追跡設計とアクセス形態多様化(リモート利用、年更新ライセンス等)が課題。海外事例は日本版サンプル開発や国際比較研究の設計指針を与え、層別抽出サンプル追加、OPEN COHORT的更新、年間ライセンス制+リモート利用などが求められる。これは政策実装の即応性向上にも寄与し得る。
総合的知見として、申請〜利用開始期間短縮と仮想環境性能を確認。自動集計スクリプト等は共有価値が高い。HICポータルはUI・情報共有・質問割当てに改善余地大。海外事例は多様な提供形態を示唆。
限界点として単年度・単一研究グループでの検証であり一般化可能性検証が必要だが、本研究の実測値と改善提案はHIC運用高度化の基礎資料として有用と考える。
網羅的記述統計・テンプレート整備では、全テーブル・カラムの記述統計自動抽出によりデータディクショナリとSQL雛形を生成し、初学者の変数探索効率化を確認した。ER図と推奨手順も整理。クラウド環境での複数拠点同時操作はメリットであった。これらの共有は協働研究を促進する。
HICポータル運用評価では、オンライン申請で複数施設入力不可や一時保存不可等の構造的制約、掲示板・メッセージの使い分け周知不足、ユーザー登録の遅延が判明。改善策として複数施設入力フィールド追加、下書き保存機能、質問自動分類アルゴリズム導入を提案した。特に掲示板質問の回答主体分散はタグ付けルーティングが有効とした。
解析環境の課題としてPowerShell操作不慣れと診療報酬マスタ欠落が挙がったが、FAQ・サンプルスクリプト、マスタ共有機能で解決可能と評価。マニュアル形式・配置、緊急メンテナンスの影響も報告された。CSV→DB化はPowerShell操作とマスタ整備に依存し、これら支援の常設化が重要である。
海外追跡サンプルとの比較では、台湾NHIRD(大規模サンプル、オンサイト)、韓国NHIS(OPEN COHORT、リモート可)、英国CPRD(長期縦断、年額ライセンス制)を調査。日本版は全量データで網羅性が高い一方、追跡設計とアクセス形態多様化(リモート利用、年更新ライセンス等)が課題。海外事例は日本版サンプル開発や国際比較研究の設計指針を与え、層別抽出サンプル追加、OPEN COHORT的更新、年間ライセンス制+リモート利用などが求められる。これは政策実装の即応性向上にも寄与し得る。
総合的知見として、申請〜利用開始期間短縮と仮想環境性能を確認。自動集計スクリプト等は共有価値が高い。HICポータルはUI・情報共有・質問割当てに改善余地大。海外事例は多様な提供形態を示唆。
限界点として単年度・単一研究グループでの検証であり一般化可能性検証が必要だが、本研究の実測値と改善提案はHIC運用高度化の基礎資料として有用と考える。
結論
NDB 通年パネルは承諾後45 日で利用開始でき、仮想環境は全表横断解析に耐えうる性能を有した。HIC ポータル UI と質問ルーティングには改善余地が残り、海外事例に学ぶ柔軟なアクセス形態の導入が今後の課題と考えられた。
公開日・更新日
公開日
2025-06-27
更新日
-