レセプト情報・特定健診等情報データベースの利活用の推進に関する研究

文献情報

文献番号
201501022A
報告書区分
総括
研究課題名
レセプト情報・特定健診等情報データベースの利活用の推進に関する研究
課題番号
H27-政策-指定-008
研究年度
平成27(2015)年度
研究代表者(所属機関)
大江 和彦(東京大学医学部附属病院 企画情報運営部)
研究分担者(所属機関)
  • 今中 雄一(京都大学大学院)
  • 満武 巨裕(医療経済研究・社会保険福祉協会 医療経済研究機構)
研究区分
厚生労働科学研究費補助金 行政政策研究分野 政策科学総合研究(政策科学推進研究)
研究開始年度
平成27(2015)年度
研究終了予定年度
平成28(2016)年度
研究費
3,478,000円
研究者交替、所属機関変更
-

研究報告書(概要版)

研究目的
わが国独自のレセプト情報・特定健診等情報データベース(NDB)の利活用推進のための分野横断型の研究は十分には議論されておらず、データ解析環境、研究手法、システム処理工程、本データ精度、一般研究者の潜在的ニーズ、などの多くは不明なままである。
そこで本研究において初年度のH27年度は、①NDBの特別抽出データの利活用環境に関する検討、②NDB基本データセットの利活用に関わる課題調査、③諸外国(米国、韓国)のレセプトデータ利用環境の調査、等を実施する。
研究方法
1)NDBの特別抽出データの、データベースとしての有効活用に関する問題点と改善点の検討: 研究分担者がNDBより特別抽出として、2016年3月までNDBデータの提供を受けた。このデータ解析実施期間中に生じた問題点のうち、データベースを効率的に利用するにあたっての問題点を記録し、その解決策を考察した。
また、同研究分担者の研究室サーバー環境のセキュリティーの評価: DB特別抽出に関してセキュリティーを確保した運営を行っているサーバシステムにおける自営(オンプレミス)運用でのセキュリティーの脆弱性について、専門機関に委託し診断を行った。
2)基本データセットの利活用に関する課題を、脳血管疾患を発症した患者の診療プロセスとアウトカムの関連分析をする研究目的で研究代表者が申請手続きを経て受領したプロセスを元に、①抽出項目の設定方法、②抽出プログラム、③データ精度、の観点から検討した。
3)諸外国のClaim Databaseの利用環境提供状況の調査のため、韓国患者サンプルデータ、および米国CMSバーチャルアクセス機能の提供状況について調査した。
結果と考察
結果:1)RDB格納に要する時間が膨大である点が大きな研究開始時の障害で合った。け取りデータを加工し、解析用に抽出するためのサーバーとして、全国規模の解析を行う際データが大量となるが、ネットワークに接続しないローカル機器をあらかじめこのために準備するのは、研究者にとって事前想定不能な資源準備が必要であるため研究開始時の障害となる。③大きな計算機資源(計算能力とストレージ)を研究室単位で必要とし、研究室だけで一時的にその計算機資源を持つことは困難であった。セキュリティー面では重大な脆弱性は見つからなかった。
2)短所として基本データセットの抽出上限が256項目のため、抽出項目は制限せざるを得ない点が挙げられた。データセットの精度・基本統計量については、今回抽出条件を工夫したにもかかわらず、推計患者数は必ずしも妥当ではなかったが原因は多岐にわたり、不明な点も多かった。
3)韓国のHIRA-NPSは5種類のテーブルで構成され、国家入院サンプル、国家高齢者(65歳以上)サンプル、および小児患者サンプルが追加された。米国のCMSのVRDCは研究者のワークステーションやPCからCMSデータの独自の操作・分析を行うことができることがわかった。
考察:1)特別抽出における課題の改善:データ提供(受領)形式をRDBデータベース形式とするか、利活用者が指定する圧縮形式とすることにより、受領者がより容易かつ効率的に自身のデータ解析環境にデータ展開できる。
計算機資源として利活用者がネットワークに接続しないローカルで本利活用専用の計算機資産として保有する資源だけを活用して解析できることを前提とするには、データの規模が大きすぎる。一定の条件を満たすクラウド計算機資源、大学内の高速計算機資源などを活用できるようにすることで劇的に改善すると考えられる。実際、ゲノム解析センターでは高速計算機資源を共用することが当然になっている。
2)基本データセットの長所をさらに生かすためには、抽出条件項目の数を大幅に増やすことと、抽出後のデータ確認やサブセット作成のためのプログラムライブラリを整備することが必要であろう。またデータの精度や学術的利活用の観点からも基本データセットの制約条件について見直しを検討する必要性が示唆された。
3)韓国のHIRA-NPSは5種類のテーブル、および米国のCMSのVRDCは今後のNDBの提供と利活用体制のありかたに示唆を与える。
結論
NDBのデータの規模の大きさから生じる「ビッグデータを研究室レベルで扱う困難さ」に研究者は直面しつつある。これを改善するには、柔軟で効率的な大規模計算機資源の活用体制、基本データセットでさえも抽出条件等で柔軟で制約緩和が必要であることが示唆された。これらの解決方策として、韓国で始められた学会と共同で検証した患者サンプルデータセットの考え方、またデータは直接入手しないで計算機資源をネットワークで利用しない米国VRDCのあり方は参考になると考えられた。

公開日・更新日

公開日
2016-11-11
更新日
-

収支報告書

文献番号
201501022Z
報告年月日

収入

(1)補助金交付額
3,997,929円
(2)補助金確定額
3,997,929円
差引額 [(1)-(2)]
0円

支出

研究費 (内訳) 直接研究費 物品費 1,528,663円
人件費・謝金 139,550円
旅費 652,109円
その他 1,155,607円
間接経費 522,000円
合計 3,997,929円

備考

備考
-

公開日・更新日

公開日
2018-06-15
更新日
-