指定難病患者データベース、小児慢性特定疾病児童等データベースと他の行政データベースとの連携についての研究

文献情報

文献番号

202011017A

報告書区分

総括

研究課題名

指定難病患者データベース、小児慢性特定疾病児童等データベースと他の行政データベースとの連携についての研究

研究課題名（英字）

課題番号

H30-難治等（難）-一般-019

研究年度

令和2(2020)年度

研究代表者(所属機関)

野田　龍也(公立大学法人奈良県立医科大学　医学部公衆衛生学講座)

研究分担者(所属機関)

久保慎一郎(奈良県立医科大学附属病院　看護部)
和田隆志(国立大学法人　金沢大学　事務局)
原章規(金沢大学　医薬保健研究域医学系)
古澤嘉彦(武田薬品工業株式会社ジャパンメディカルオフィス)
盛一享徳(国立成育医療研究センター)
秋丸裕司(国立研究開発法人　医薬基盤・健康・栄養研究所　難治性疾患研究開発・支援センター)
小松雅代(大阪大学大学院医学系研究科)
佐藤大介(国立大学法人千葉大学医学部附属病院)

研究区分

厚生労働科学研究費補助金疾病・障害対策研究分野難治性疾患政策研究

研究開始年度

平成30(2018)年度

研究終了予定年度

令和2(2020)年度

研究費

8,000,000円

研究者交替、所属機関変更

研究報告書（概要版）

研究目的

我が国の保健医療分野のデータベース（DB）は、政府主導でDB間の連携等が推進されている。国が有する各種DBの中でも、レセプト情報・特定健診等情報データベース（NDB)は我が国の保険診療の悉皆調査であり、世界最大級のヘルスデータである。本研究は、難病施策への反映を念頭に、難病DB、小慢DBと他の行政データベース（NDB、介護DB等）との連結に関する利点や課題を技術的、法的、倫理的側面から整理し、連携に必要な解決策を具体的に提示することを目的としている。

研究方法

令和2年度は、昨年度に引き続き、DB結合に関する論点整理を進めるとともに、NDBを用いた全指定難病の患者数推計（集計用の名寄せ技術の刷新による再集計）、医療費シミュレーションを行った。

結果と考察

本研究においては、DB同士の結合（連結とも言う。）を、各DBに含まれる個別の単位（個人、施設など）を複数DB間で紐つけることと定義した。例えば、NDBの類似データベースであるKDBと介護DBとの結合では、人工栄養の種別（KDB事項）による院内外の療養場所（KDB及び介護DB事項）の分布が一元的に把握できることが明らかとなった。
DB結合の利点・問題点は、実際に結合されたデータを提供して初めて明らかになることが多いと考えられる。現時点において、NDBに関しては他のDBとの結合はガイドラインで禁止されており、今回研究班の課題でもない。一方、将来的な結合を見据え、ダミーデータ等を用いて、結合のシミュレーションを行うことはありえる選択肢であると考えられた。
複数DBの結合は、レコードリンケージ（同一人物のデータの結合）を想定することが多いが、レコードリンケージには名寄せの成功率に応じて諸段階があると考えるべきである。結合対象のDBに同一の個人識別番号が格納されていれば、一般的には名寄せは成功する。複数DBに同一の個人識別番号が格納されていない場合は、氏名、被保険者番号、疾患名など複数個の変数を組み合わせて1つの変数とし、結合を試みる方法がある（ｎ情報ハッシュ）。また、レコードリンケージを目指さず、集団の値の相関や近似性を分析する生態学的研究もある。
現在、医療等IDが実装されつつあるが、実装前のデータはレコードリンケージができないため、そのようなDBにおいては、まずn情報ハッシュによるレコードリンケージを試み、対応できないほど技術的な課題が大きい場合、時間的な余裕がない場合は生態学的研究（集団相関研究）を試みることが望ましい。
ｎ情報ハッシュを行う場合の問題点として、項目内容の差異や表記ゆれの問題がある。これらの問題は、「レコードリンケージのためのｎ情報ハッシュの生成」と「結合後の利用」の両面において最大級の阻害要因となることが予想される。基本的な医療情報である病名についても、例えば指定難病の告示病名と電子カルテ等で利用される病名の表記に多対多対応や対応なし等のズレが残存している状況である。
結合データの提供及び分析に際しては、結合データを適正・有効に利活用することを目的とした、データ収集・利用目的・第三者提供のルールと枠組みが必要であり、結合データの活用を希望する団体・個人に情報提供の場を設けるなどの対応が考えられる。
指定難病333疾患の患者数推計については、指定難病の病名が付与された患者を対象に一定の患者定義アルゴリズムに基づき、NDBを用いた患者集計の概算を算出した。ただし、ID0という名寄せIDを用いた前年度集計と比べてもID0v2という今回の新しい名寄せIDを用いた再集計は、病名によって衛生行政報告例に比べ過大・過少になる幅が大きいなど課題は変わらなかった。
難病医療費の公費部分の推計については、難病加算の算定されているレセプトについて、患者（id0）ごと・診療月ごとに、医科レセプト・DPCレセプト・調剤レセプトの点数を合計し、70歳以上と70歳未満の医療費分布（仮定1）から、階層区分ごとの人数割合（仮定２）別に公費の推計を行った。NDBから推計した年間公費総額は¥95,393,387,741となり、実績値である¥155,082,647,278を下回る結果となった。階層区分の分布についての仮定２の影響を見るために、特記区分にア～オ以外が記載されていた場合は、「一般」（区エ）とした場合についても公費の推計を行ったが、仮定２を採用した場合と比べ、大きく変化しなかった。

結論

本年度は研究班の最終年度として、DB結合の利点、病名等の表記ゆれの問題点の整理、この問題点に関連して複数情報利用ハッシュの実現可能性、NDBをハブとする結合の提案、データベース医学特有の知識の共有する研修会の提案などを行った。また、分担研究として、ID0v2を用いた患者数推計と医療費シミュレーションを実施した。

公開日・更新日

公開日

2021-07-01

更新日

研究報告書（PDF）

一括ダウンロード用PDF

表紙

総括・分担研究報告書別紙1_表紙 [42.99 KB]

総括・分担研究報告書別紙2_目次 [65.45 KB]

総括研究報告書

総括・分担研究報告書別紙3_総括 [1.89 MB]

分担研究報告書

総括・分担研究報告書別紙4_分担 [1.53 MB]

研究成果の刊行に関する一覧表

研究成果の刊行に関する一覧表別紙_5 [86.38 KB]

倫理審査等報告書の写し

倫理審査等報告書の写し別紙_6 [3.31 MB]

公開日・更新日

公開日

2021-07-01

更新日

2021-08-18

研究報告書（紙媒体）

文献情報

文献番号

202011017B

報告書区分

総合

研究課題名

指定難病患者データベース、小児慢性特定疾病児童等データベースと他の行政データベースとの連携についての研究

研究課題名（英字）

課題番号

H30-難治等（難）-一般-019

研究年度

令和2(2020)年度

研究代表者(所属機関)

野田　龍也(公立大学法人奈良県立医科大学　医学部公衆衛生学講座)

研究分担者(所属機関)

久保慎一郎(奈良県立医科大学附属病院　看護部)
和田隆志(国立大学法人　金沢大学　事務局)
原章規(金沢大学　医薬保健研究域医学系)
古澤嘉彦(武田薬品工業株式会社　ジャパンメディカルオフィス)
盛一享徳(国立成育医療研究センター)
秋丸裕司(国立研究開発法人　医薬基盤・健康・栄養研究所　難治性疾患研究開発・支援センター)
小松雅代(大阪大学　大学院医学系研究科)
佐藤大介(国立大学法人千葉大学　医学部附属病院)

研究区分

厚生労働科学研究費補助金疾病・障害対策研究分野難治性疾患政策研究

研究開始年度

平成30(2018)年度

研究終了予定年度

令和2(2020)年度

研究者交替、所属機関変更

研究報告書（概要版）

研究目的

我が国の保健医療分野のデータベース（DB）は、政府主導でDB間の連携等が推進されている。レセプト情報・特定健診等情報データベース（NDB)は我が国の保険診療の悉皆調査であり、世界最大級のヘルスデータである。本研究の目的は、難病施策への反映を念頭に、NDBや介護DBと難病DB、小慢DBとの連携及び連結に関する利点や課題を技術的、法的、倫理的側面から整理し、DB間の連携及び連結に必要な解決策を具体的に提示することである。

研究方法

平成30年度は、個々のデータベースの抱える現状と課題を整理し、データベース間の連携及び連結に関する課題を整理した。NDBと難病・小児慢性疾患のデータベースの連携等を検討するにあたって、特定の疾患（多発性硬化症と潰瘍性大腸炎）を選定し、NDBを用いたモデル集計に着手した。
令和元年度は、DB結合の論点整理とNDBを用いた疾患定義・集計の2つの研究を実施した。
令和2年度は、令和元年度に引き続き、DB結合に関する論点整理を進めるとともに、NDBを用いた疾患定義・集計を実施した。これらの技術を活用し、全指定難病（現在は333疾患）患者数集計や公費負担の医療費分析を実施した。また、医療保険制度を変更した場合に難病医療費と本人負担がどのように変わるかシミュレーションを行った。

結果と考察

平成30年度の結果として、データベース結合の課題整理では、データベースの連携と連結に関する全体階層図の作成や、NDBと難病・小慢DBとの連携・結合の課題の検討と整理、難病DB及び小慢DBの課題整理などを行った。NDBを用いたモデル集計では、対象疾患として多発性硬化症と潰瘍性大腸炎を選定し、NDBによる集計方法の設計に着手した。
令和元年度の結果として、DB結合の論点整理においては、DBの連携と結合の違いを整理するとともに、DB同士の結合を行う際、一意かつ不変の識別子（医療等IDなど）の存在が重要であること、そのような識別子が存在しない現状においては、DBの連携と結合にはいくつかの段階があること、DBの連携及び結合に向けた課題は、医療等ID（一意かつ不変のID）の実現前と後で異なると考えられ、また、法令、行政手続、倫理、技術的課題といった課題の種別ごとの検討が重要であることなどをまとめた。NDBを用いた疾患定義・集計においては、指定難病のうちの3疾患を例とするNDB疾患定義（疾患バリデーション）の試行的な構築やステロイドパルス療法を例とした難病患者への治療の実態の試行的な把握、医療費の集計を行うとともに、対象を全指定難病（現在は333疾患）に広げた患者数集計や医療費分析を本邦で初めて実施し、結果を公表した。
令和2年度の結果として、まず、DB結合に関しては、DB同士の結合（連結とも言う。）を、各DBに含まれる個別の単位（個人、施設など）を複数DB間で紐つけることと定義した。例えば、NDBの類似データベースであるKDBと介護DBとの結合では、人工栄養の種別（KDB事項）による院内外の療養場所（KDB及び介護DB事項）の分布が一元的に把握できることが明らかとなった。
複数DBの結合は、レコードリンケージ（同一人物のデータの結合）を想定することが多いが、レコードリンケージには名寄せの成功率に応じて諸段階があると考えるべきである。結合対象のDBに同一の個人識別番号が格納されていれば、一般的には名寄せは成功する。複数DBに同一の個人識別番号が格納されていない場合は、氏名、被保険者番号、疾患名など複数個の変数を組み合わせて1つの変数とし、結合を試みる方法がある（ｎ情報ハッシュ）。また、レコードリンケージを目指さず、集団の値の相関や近似性を分析する生態学的研究もある。
ｎ情報ハッシュの問題点として、項目内容の差異や表記ゆれの問題がある。つまり、同一に思える項目であっても表記基準や表現にバリエーションがあることがあり、さらには、同じDB内でも表記ゆれが許されていることもある（例：性別における女性、女、Fなど）。このようなゆれは、「レコードリンケージのためのｎ情報ハッシュの生成」と「結合後の利用」の両面において最大級の阻害要因となることが予想される。
NDBを用いた患者数推計及び医療費シミュレーションにおいては、指定難病の疾患定義について、疾患名だけでなく難病加算を同時に用いる手法を提示した。さらに、NDBを用いた指定難病（全333疾患）の患者数を「ID0v2」と呼ばれる新名寄せ変数を用いて算出するとともに、難病総医療費を初めて試算した。

結論

本研究により、個々のデータベースの現状と課題が整理された。また、レセプトデータ（NDB）を用いたすべての指定難病（現在は333疾患）における患者数集計や医療費分析を行った。

公開日・更新日

公開日

2021-07-01

更新日

研究報告書（PDF）

一括ダウンロード用PDF

表紙

総合研究報告書　別紙1_表紙 [44.04 KB]

総合研究報告書　別紙2_目次 [264.21 KB]

総合研究報告書

総合研究報告書　別紙3_平成30 年度～令和2 年度報告書 [18.66 MB]

研究成果の刊行に関する一覧表

研究成果の刊行に関する一覧表別紙_4 [85.99 KB]

公開日・更新日

公開日

2021-07-01

更新日

研究報告書（紙媒体）

行政効果報告

文献番号

202011017C

収支報告書

文献番号

202011017Z

報告年月日

2021年12月03日

収入

(1)補助金交付額

8,000,000円

(2)補助金確定額

8,000,000円

差引額 [(1)-(2)]

0円

支出

研究費 (内訳)	直接研究費	物品費	3,679,299円
		人件費・謝金	1,412,469円
		旅費	124,440円
		その他	2,783,792円
	間接経費		0円
合計			8,000,000円

備考

公開日・更新日

公開日

2021-12-03

更新日