文献情報
文献番号
201601017A
報告書区分
総括
研究課題名
レセプト情報・特定健診等情報データベースの利活用の推進に関する研究
課題番号
H27-政策-指定-008
研究年度
平成28(2016)年度
研究代表者(所属機関)
大江 和彦(東京大学医学部附属病院 企画情報運営部)
研究分担者(所属機関)
- 今中 雄一(京都大学大学院医学研究科 医療経済学分野)
- 満武 巨裕(一般財団法人医療経済研究・社会保険福祉協会 医療経済研究機構)
研究区分
厚生労働科学研究費補助金 行政政策研究分野 政策科学総合研究(政策科学推進研究)
研究開始年度
平成27(2015)年度
研究終了予定年度
平成28(2016)年度
研究費
3,000,000円
研究者交替、所属機関変更
-
研究報告書(概要版)
研究目的
日本におけるレセプト情報・特定健診等情報データベース(以下、NDB)の情報提供機能の充実と利用についての課題および解決方法について検討する。研究利用として提供している特別抽出、サンプリングデータ、基本データセット、NDB オープンデータをはじめとする情報提供機能の充実と利用が必要であるが、潜在的に存在していると考えられる課題をとりあげ、その検討を行う。
研究方法
今年度は、①ID による同一患者の名寄せ手法、②信頼できる傷病名情報の取得方法、③NDB 特別抽出データの取得と処理方法の効率化、④基本データセットの作成方法、⑤NDB オープンデータの役割および利用例としての国際比較データの作成、の5点について取り上げた。
結果と考察
①ID による同一患者の名寄せ手法に関する検討
開発した統合 ID 生成アルゴリズムを適用した結果、患者 ID1 と患者 ID2 の組合せ数に対する統合 ID 数は 42%となった。こうしたハッシュ化患者 ID の問題に対する根本的な解決は、全レセプトデータを管理する機関が、正確な被保険者台帳を管理運用することであろう。
②信頼できる傷病名情報の取得方法の検討
レセプトに登録された診療行為と傷病名の適用関係データベースを利用した診療行為から傷病名にウエイトをつけて評価した先行研究では、ほぼ疑いなく患者に存在する傷病名の推定は93%の正確さであったとの報告があり、連続する数ヶ月のレセプトを処理することで性能が上がる可能性が指摘されている。機械学習と上記手法とを組み合わせた傷病名推定を行うことにより、精度の高い傷病名推定ができる可能性がある。
③NDB 特別抽出データの取得と処理方法の効率化に関する検討
ボトルネックになっている行程が、大きく 3 つあると考えられた。ⅰ)有識者会議の承諾から承諾通知発出の間ⅱ)データ返却、或いは承諾通知発出からデータ抽出作業開始の間ⅲ)データ抽出作業完了から提供データ格納用外付けハードディスク到着の間これらに対し、ⅰ)は厚生労働省の事務処理、ⅱ)は厚生労働省およびデータ抽出作業担当も含めた全体的なスケジュール調整・管理、ⅲ)はデータ抽出作業担当からの連絡を改善することによって、それぞれ解消が図られると考えられた。
④基本データセットの作成方法に関する検討
基本データセットは、試行として 2 利用者にデータが提供されたが、課題となったのが、ユーザーが独自に指定する診療行為コードや医薬品コードの上限256という制約である。利用者が分析上条件設定として必要とする診療行為や医薬品はこの制約よりはるかに多いことがわかった。これを解決するには、各診療行為や医薬品をカテゴリーに抽象化するなどの手法が必要である。
⑤NDB オープンデータの役割、および利用例としての国際比較データの作成に関する検討
都道府県ごとに、高齢者人口を医療需要総量を反映するものとみなして、どれだけの提供量があるかを示した。これらの指標は、治療へのアクセスの指標ともなりうると考えられる。一方で、都道府県内でも、地域間の格差が大きく、これらの指標は、各県内の格差の大きい地域を足し合わせた平均値である点に、特に留意すべきである。
NDB オープンデータを利用によりOECD加盟国間で比較可能なデータを作成できた。国際機関は、医療及び介護分野における政策立案に資する国際統計報告として様々な HQの迅速な提供を各国に求めているが、日本が国際機関に提出している厚生労働統計分野の項目数は少ない。そのため、日本はデータ提出状況を改善することが望ましい。日本の全人口の保険医療記録から作成されたデータは、国内だけではなく諸外国に向けた情報としても価値のあるものと考えられる。
開発した統合 ID 生成アルゴリズムを適用した結果、患者 ID1 と患者 ID2 の組合せ数に対する統合 ID 数は 42%となった。こうしたハッシュ化患者 ID の問題に対する根本的な解決は、全レセプトデータを管理する機関が、正確な被保険者台帳を管理運用することであろう。
②信頼できる傷病名情報の取得方法の検討
レセプトに登録された診療行為と傷病名の適用関係データベースを利用した診療行為から傷病名にウエイトをつけて評価した先行研究では、ほぼ疑いなく患者に存在する傷病名の推定は93%の正確さであったとの報告があり、連続する数ヶ月のレセプトを処理することで性能が上がる可能性が指摘されている。機械学習と上記手法とを組み合わせた傷病名推定を行うことにより、精度の高い傷病名推定ができる可能性がある。
③NDB 特別抽出データの取得と処理方法の効率化に関する検討
ボトルネックになっている行程が、大きく 3 つあると考えられた。ⅰ)有識者会議の承諾から承諾通知発出の間ⅱ)データ返却、或いは承諾通知発出からデータ抽出作業開始の間ⅲ)データ抽出作業完了から提供データ格納用外付けハードディスク到着の間これらに対し、ⅰ)は厚生労働省の事務処理、ⅱ)は厚生労働省およびデータ抽出作業担当も含めた全体的なスケジュール調整・管理、ⅲ)はデータ抽出作業担当からの連絡を改善することによって、それぞれ解消が図られると考えられた。
④基本データセットの作成方法に関する検討
基本データセットは、試行として 2 利用者にデータが提供されたが、課題となったのが、ユーザーが独自に指定する診療行為コードや医薬品コードの上限256という制約である。利用者が分析上条件設定として必要とする診療行為や医薬品はこの制約よりはるかに多いことがわかった。これを解決するには、各診療行為や医薬品をカテゴリーに抽象化するなどの手法が必要である。
⑤NDB オープンデータの役割、および利用例としての国際比較データの作成に関する検討
都道府県ごとに、高齢者人口を医療需要総量を反映するものとみなして、どれだけの提供量があるかを示した。これらの指標は、治療へのアクセスの指標ともなりうると考えられる。一方で、都道府県内でも、地域間の格差が大きく、これらの指標は、各県内の格差の大きい地域を足し合わせた平均値である点に、特に留意すべきである。
NDB オープンデータを利用によりOECD加盟国間で比較可能なデータを作成できた。国際機関は、医療及び介護分野における政策立案に資する国際統計報告として様々な HQの迅速な提供を各国に求めているが、日本が国際機関に提出している厚生労働統計分野の項目数は少ない。そのため、日本はデータ提出状況を改善することが望ましい。日本の全人口の保険医療記録から作成されたデータは、国内だけではなく諸外国に向けた情報としても価値のあるものと考えられる。
結論
以上のように課題はまだまだ多いが、患者 ID の取扱い、オープンデータの利用、特別抽出データの利用を含む NDB データ活用につき、具体的課題と対応を明確にした。当研究成果が公に広く提供されることにより、今後の NDB データの提供側、およびデータの利用側にとっても、活用推進に役立つと思われる。また NDB オープンデータから生成できるデータを使用した国際統計報告は、諸外国の行政関係者や研究者への波及効果も生み出し得るものであると考える。厚生労働省が 2009 年から収集を開始した NDB は、ヘルスケア分野における最大規模のリアルワールド・データベースであり、そこから作成された二次データであるNDB オープンデータとともに、国内だけではなく諸外国に向けた情報としても価値のあるものと考えられる。
公開日・更新日
公開日
2017-11-16
更新日
-