レセプト情報・特定健診等情報データベースの利活用の推進に関する研究

文献情報

文献番号

201601017A

報告書区分

総括

研究課題名

レセプト情報・特定健診等情報データベースの利活用の推進に関する研究

研究課題名（英字）

-

課題番号

H27-政策-指定-008

研究年度

平成28(2016)年度

研究代表者(所属機関)

大江　和彦(東京大学医学部附属病院　企画情報運営部)

研究分担者(所属機関)

今中　雄一(京都大学大学院医学研究科　医療経済学分野)
満武　巨裕(一般財団法人医療経済研究・社会保険福祉協会　医療経済研究機構)

研究区分

厚生労働科学研究費補助金行政政策研究分野政策科学総合研究（政策科学推進研究）

研究開始年度

平成27(2015)年度

研究終了予定年度

平成28(2016)年度

研究費

3,000,000円

研究者交替、所属機関変更

-

研究報告書（概要版）

研究目的

日本におけるレセプト情報・特定健診等情報データベース（以下、NDB）の情報提供機能の充実と利用についての課題および解決方法について検討する。研究利用として提供している特別抽出、サンプリングデータ、基本データセット、NDB オープンデータをはじめとする情報提供機能の充実と利用が必要であるが、潜在的に存在していると考えられる課題をとりあげ、その検討を行う。

研究方法

今年度は、①ID による同一患者の名寄せ手法、②信頼できる傷病名情報の取得方法、③NDB 特別抽出データの取得と処理方法の効率化、④基本データセットの作成方法、⑤NDB オープンデータの役割および利用例としての国際比較データの作成、の５点について取り上げた。

結果と考察

①ID による同一患者の名寄せ手法に関する検討
　開発した統合 ID 生成アルゴリズムを適用した結果、患者 ID1 と患者 ID2 の組合せ数に対する統合 ID 数は 42%となった。こうしたハッシュ化患者 ID の問題に対する根本的な解決は、全レセプトデータを管理する機関が、正確な被保険者台帳を管理運用することであろう。
②信頼できる傷病名情報の取得方法の検討
　レセプトに登録された診療行為と傷病名の適用関係データベースを利用した診療行為から傷病名にウエイトをつけて評価した先行研究では、ほぼ疑いなく患者に存在する傷病名の推定は９３％の正確さであったとの報告があり、連続する数ヶ月のレセプトを処理することで性能が上がる可能性が指摘されている。機械学習と上記手法とを組み合わせた傷病名推定を行うことにより、精度の高い傷病名推定ができる可能性がある。
③NDB 特別抽出データの取得と処理方法の効率化に関する検討
　ボトルネックになっている行程が、大きく 3 つあると考えられた。ⅰ）有識者会議の承諾から承諾通知発出の間ⅱ）データ返却、或いは承諾通知発出からデータ抽出作業開始の間ⅲ）データ抽出作業完了から提供データ格納用外付けハードディスク到着の間これらに対し、ⅰ）は厚生労働省の事務処理、ⅱ）は厚生労働省およびデータ抽出作業担当も含めた全体的なスケジュール調整・管理、ⅲ）はデータ抽出作業担当からの連絡を改善することによって、それぞれ解消が図られると考えられた。
④基本データセットの作成方法に関する検討
　基本データセットは、試行として 2 利用者にデータが提供されたが、課題となったのが、ユーザーが独自に指定する診療行為コードや医薬品コードの上限２５６という制約である。利用者が分析上条件設定として必要とする診療行為や医薬品はこの制約よりはるかに多いことがわかった。これを解決するには、各診療行為や医薬品をカテゴリーに抽象化するなどの手法が必要である。
⑤NDB オープンデータの役割、および利用例としての国際比較データの作成に関する検討
　都道府県ごとに、高齢者人口を医療需要総量を反映するものとみなして、どれだけの提供量があるかを示した。これらの指標は、治療へのアクセスの指標ともなりうると考えられる。一方で、都道府県内でも、地域間の格差が大きく、これらの指標は、各県内の格差の大きい地域を足し合わせた平均値である点に、特に留意すべきである。
　NDB オープンデータを利用によりOECD加盟国間で比較可能なデータを作成できた。国際機関は、医療及び介護分野における政策立案に資する国際統計報告として様々な HQの迅速な提供を各国に求めているが、日本が国際機関に提出している厚生労働統計分野の項目数は少ない。そのため、日本はデータ提出状況を改善することが望ましい。日本の全人口の保険医療記録から作成されたデータは、国内だけではなく諸外国に向けた情報としても価値のあるものと考えられる。

結論

以上のように課題はまだまだ多いが、患者 ID の取扱い、オープンデータの利用、特別抽出データの利用を含む NDB データ活用につき、具体的課題と対応を明確にした。当研究成果が公に広く提供されることにより、今後の NDB データの提供側、およびデータの利用側にとっても、活用推進に役立つと思われる。また NDB オープンデータから生成できるデータを使用した国際統計報告は、諸外国の行政関係者や研究者への波及効果も生み出し得るものであると考える。厚生労働省が 2009 年から収集を開始した NDB は、ヘルスケア分野における最大規模のリアルワールド・データベースであり、そこから作成された二次データであるNDB オープンデータとともに、国内だけではなく諸外国に向けた情報としても価値のあるものと考えられる。

公開日・更新日

公開日

2017-11-16

更新日

-

研究報告書（紙媒体）

文献情報

文献番号

201601017B

報告書区分

総合

研究課題名

レセプト情報・特定健診等情報データベースの利活用の推進に関する研究

研究課題名（英字）

-

課題番号

H27-政策-指定-008

研究年度

平成28(2016)年度

研究代表者(所属機関)

大江　和彦(東京大学医学部附属病院　企画情報運営部)

研究分担者(所属機関)

今中　雄一(京都大学大学院医学研究科　医療経済学分野)
満武　巨裕(一般財団法人医療経済研究・社会保険福祉協会　医療経済研究機構)

研究区分

厚生労働科学研究費補助金行政政策研究分野政策科学総合研究（政策科学推進研究）

研究開始年度

平成27(2015)年度

研究終了予定年度

平成28(2016)年度

研究者交替、所属機関変更

-

研究報告書（概要版）

研究目的

レセプト情報・特定健診等情報データベース（NDB）は、平成21年から収集され、現在100億件のレセプトが格納されている。しかし大規模データの処理、学術研究に必要な精度管理、個人情報の取扱等課題は多い。本研究では、これらの課題を共有し改善方法を検討する。

研究方法

平成27年度は、①NDBの特別抽出データの利活用環境に関する検討、②NDB基本データセットの利活用に関わる課題調査、③諸外国（米国、韓国）のレセプトデータ（Claim Database）のデータ提供と利用環境の調査検討、等を実施した。また平成28年度は同年度から提供が開始されたNDBオープンデータとともに、その情報提供機能の充実と利用に関して潜在的に存在していると考えられる課題も含めてとりあげ、その解決方法についても検討した。具体的には、①IDによる同一患者の名寄せ手法、②信頼できる傷病名情報の取得方法、③NDB特別抽出データの取得と処理方法の効率化、④基本データセットの作成方法、⑤NDBオープンデータの役割および利用例としての国際比較データの作成、の５点について検討した。

結果と考察

１）IDによる同一患者の名寄せ手法に関する検討：氏名の入力ゆれや改名の発生頻度は、保険者番号・記号番号の入力ゆれや保険の変更の発生頻度よりも低いものの、小さいものではないといえる。開発した統合ID生成アルゴリズムを適用した結果、患者ID1と患者ID2の組合せ数に対する統合ID数は42%となった。NDBでは、レセプトデータが患者ごとに連結されず、医療機関ｘ保険者ｘ個人ｘ受診年月、に分断されたデータ単位として匿名化されているためにこれらの分断データ単位を再結合することが非常に困難になっている。匿名化IDが保険者間での結合できるように、全レセプトデータを管理する機関が正確な被保険者台帳を管理運用することであろう。
２）信頼できる傷病名情報の取得方法の検討
セプトに登録された診療行為と傷病名の適用関係データベースを利用した診療行為から傷病名にウエイトをつけて評価した先行研究では、ほぼ疑いなく患者に存在する傷病名の推定は９３％の正確さであったとの報告があり、連続する数ヶ月のレセプトを処理することで性能が上がる可能性が指摘されている。機械学習と上記手法とを組み合わせた傷病名推定を行うことにより、精度の高い傷病名推定ができる可能性がある。
３）NDBの特別抽出データの利活用環境に関する検討
　NDBのデータの規模の大きさから生じる「ビッグデータを研究室レベルで扱う困難さ」に研究者は直面しつつある。これを改善するには、柔軟で効率的なクラウド環境を含めた大規模計算機資源の活用体制、基本データセットでさえも抽出条件等で柔軟で制約緩和が必要であることが示唆された。また、データ提供にかかる時間の短縮、受け取ったデータの再DB化が効率的に実現できるように、研究者が利用するデータベースエンジンを想定したデータ提供も必要で、現状のテキストデータでの提供には限度がある。また傷病名の精度確保に関する研究をさらに進める必要がある。一方、別の解決方法として、韓国で始められた学会と共同で検証した患者サンプルデータセットの考え方、またデータを直接入手しないで計算機資源をネットワークで利用しない米国VRDCのあり方は参考になると考えられた。
４）基本データセット：
　基本データセットの利点として、3年間のパネルデータとして利用可能、診療行為や医薬品など256項目まで指定した抽出が可能、分析容易なデータ形式でデータを受領可能という点が挙げられた。短所として基本データセットの抽出上限が256項目のため、抽出項目は制限せざるを得ない点が挙げられた。そこで基本データセットの抽出にはプログラム処理が別途必要であることが明らかとなった。また、各診療行為や医薬品をカテゴリーに抽象化（指定粒度を意味的に粗くする）する必要がある。
今後も、NDBからのデータ提供はとしての特別抽出、サンプリングデータセット、基本データセット、NDBオープンデータをはじめとする情報提供機能の充実と利用が必要である。

結論

以上のように課題は残っているが、患者IDの取扱い、オープンデータの利用、特別抽出データの利用を含むNDBデータ活用につき、具体的課題と今後の対応のあり方を示した。今後のNDBデータの提供側、およびデータの利用側にとっても、活用推進に役立つと思われる。またNDBオープンデータから生成できるデータを使用した国際統計報告は、諸外国の行政関係者や研究者への波及効果も生み出し得るものであると考えられた。

公開日・更新日

公開日

2017-11-16

更新日

-

研究報告書（紙媒体）

行政効果報告

文献番号

201601017C

成果

専門的・学術的観点からの成果

NDBの特別抽出ではデータ規模の大きさに起因する研究上の課題を分析し、クラウド環境を含めた大規模計算機資源の活用体制、データ提供手法について提案を行った。また基本データセットの抽出条件等で制約緩和が必要であることを示した。さらに匿名化IDが保険者間で結合できるように、全レセプトデータを管理する機関が被保険者台帳を管理運用することを提案した.以上のように患者IDの取扱い、オープンデータの利用、特別抽出データの利用を含むNDBデータ活用につき、具体的課題と今後の対応のあり方を示すことができた。

臨床的観点からの成果

NDBの解析は臨床疫学、臨床研究においても重要である。本研究において患者IDの連携方法における取扱い、オープンデータの利用とりわけ国際比較指標に利用する実例、特別抽出データと基本データセットの利用を含むNDBデータ活用につき、具体的課題と今後の対応のあり方を示すことができ、NDBを用いた臨床疫学、臨床研究にも資すると考えられる。

ガイドライン等の開発

第29回レセプト情報等の提供に関する有識者会議（平成28年3月16日）：「基本データセットの提供について」（分担研究者：満武巨裕）、第2回データヘルス時代の質の高い医療の実現に向けた有識者検討会（平成28年5月23日）：「諸外国の医療ビッグデータ」（分担研究者：満武巨裕）

その他行政的観点からの成果

第29回レセプト情報等の提供に関する有識者会議（平成28年3月16日）：「基本データセットの提供について」（分担研究者：満武巨裕）、第2回データヘルス時代の質の高い医療の実現に向けた有識者検討会（平成28年5月23日）：「諸外国の医療ビッグデータ」（分担研究者：満武巨裕）において分担研究者が報告するとともに、社会保険旬報（第2661巻:12-16,2016年）にオープンデータを用いた医療技術の利用に関する国際比較の例を公表し、オープンデータの活用方法の提示に資することができた。

その他のインパクト

一般公開ではないが誰でも参加費により参加可能な第35回医療情報学連合大会で企画シンポジウム「レセプト情報等オンサイトリサーチセンターにおけるNDBデータの利用から」（ 2016.11.2, 沖縄県宜野湾市）、および第36回同大会で企画シンポジウム「医療データベース利活用の国内基盤の最新状況ーレセプト情報等オンサイトリサーチセンターの試行的利用について」(2016.11、神奈川県横浜市)をそれぞれ開催し、検討状況等の公開を行った。

発表件数

原著論文（和文）

1件

原著論文（英文等）

0件

その他論文(和文)

2件

その他論文(英文等)

0件

学会発表(国内学会)

6件

学会発表(国際学会等)

0件

その他成果(特許の出願)

0件

その他成果(特許の取得)

0件

その他成果(施策への反映)

2件

その他成果(普及・啓発活動)

2件

特許

主な原著論文20編（論文に厚生労働科学研究費の補助を受けたことが明記された論文に限る）

論文に厚生労働科学研究費の補助を受けたことが明記された論文に限ります。

原著論文1

満武巨裕、大江和彦、今中雄一
NDBオープンデータを研究利用に活用する：医療技術(CT,MRI,PET)の利用に関する国際比較の試み
社会保険旬報 , 2661 , 12-16 (2016)

公開日・更新日

公開日

2017-11-16

更新日

2019-07-01

収支報告書

文献番号

201601017Z

報告年月日

2018年05月30日

収入

(1)補助金交付額

3,450,000円

(2)補助金確定額

3,441,000円

差引額 [(1)-(2)]

9,000円

支出

研究費 (内訳)	直接研究費	物品費	1,058,830円
		人件費・謝金	306,179円
		旅費	829,036円
		その他	797,675円
	間接経費		450,000円
合計			3,441,720円

備考

-

公開日・更新日

公開日

2018-06-15

更新日

-

レセプト情報・特定健診等情報データベースの利活用の推進に関する研究

文献情報

研究報告書（概要版）

公開日・更新日

研究報告書（PDF）

公開日・更新日

研究報告書（紙媒体）

文献情報

研究報告書（概要版）

公開日・更新日

研究報告書（PDF）

公開日・更新日

研究報告書（紙媒体）

行政効果報告

成果

発表件数

特許

主な原著論文20編（論文に厚生労働科学研究費の補助を受けたことが明記された論文に限る）

公開日・更新日

収支報告書

収入

支出

備考

公開日・更新日