文献情報
文献番号
202301009A
報告書区分
総括
研究課題名
臨床疫学に活用可能なNDB等データセットの作成に関する研究
課題番号
21AA2006
研究年度
令和5(2023)年度
研究代表者(所属機関)
森 由希子(国立大学法人 京都大学 医学部附属病院 医療情報企画部)
研究分担者(所属機関)
- 加藤 源太(京都大学医学部附属病院 病床運営管理部)
- 黒田 知宏(国立大学法人 京都大学 医学研究科)
- 植嶋 大晃(筑波大学 ヘルスサービス開発研究センター)
- 大寺 祥佑(国立研究開発法人国立長寿医療研究センター)
- 今村 知明(公立大学法人奈良県立医科大学 医学部 公衆衛生学講座)
- 野田 龍也(公立大学法人奈良県立医科大学 医学部 公衆衛生学講座)
- 康永 秀生(国立大学法人東京大学 大学院医学系研究科公共健康医学専攻臨床疫学・経済学)
- 田宮 菜奈子(国立大学法人筑波大学 医学医療系 / ヘルスサービス開発研究センター)
- 杉山 雄大(国立研究開発法人国立国際医療研究センター 研究所糖尿病情報センター)
- 中山 健夫(京都大学 大学院医学研究科)
研究区分
厚生労働科学研究費補助金 行政政策研究分野 政策科学総合研究(政策科学推進研究)
研究開始年度
令和3(2021)年度
研究終了予定年度
令和5(2023)年度
研究費
13,462,000円
研究者交替、所属機関変更
-
研究報告書(概要版)
研究目的
近年、社会情勢や人口構造の変化に伴い。健康・医療・介護分野のビッグデータ解析の必要性が高まっている。匿名医療保険等関連情報データベース(NDB)及び介護保険総合データベース(介護DB)のデータについても利活用が期待されているが、データの容量が膨大であること、データの構造が複雑であること等から、データの構造や操作を知悉した研究者でなければ解析を行うのは容易ではない。NDBや介護DB等の大規模データを簡便に分析できるようになれば、健康・医療・介護ビッグデータの利活用推進に貢献することが期待される。本研究では「健康・医療・介護分野の大規模データの利活用を推進する」ことを目的に、NDB、および介護DB、さらに令和2年から提供が開始されている医療・介護の連結情報から、より利用者にとって使いやすいデータセットを開発する。また、医療・介護データ等の解析基盤(HIC)の試行利用を行い、安全性、操作性の検証を行う。
研究方法
本研究では、利用者によるデータセット設計を補助するために「①既存の大規模データベース(NDB・介護DB)のデータ構造の評価」を実施する。また、利用者にとって使いやすいデータセットの設計のために「②長期追跡性に優れた個人名寄せIDの検討」および「③臨床系研究者でも利用可能なデータセットの開発」について検討を行う。②および③については、研究の一部をHIC上で実施し、④HICの安全性と操作性について検討を行う。2023年度において
① については、介護DBのデータ項目、データの格納状況について集計を実施し、結果を公表した。
② については、NDBに含まれる個人単位被保険者番号に基づく個人名寄せID(id5)が付与されたデータの長期追跡性について検討及び評価を行った。さらに、id5が付与される前のデータについても、既存のidとのより精緻なデータ連結の可能性について検討を行った。
③ については、今年度はNDBと介護DBの連結データの分析練習に使用可能なサンプルデータセットの仕様検討を行った。
④ については、実際のHICの利用を実施し、オンサイトリサーチセンターでのNDBデータ利用との比較検討を行った。
① については、介護DBのデータ項目、データの格納状況について集計を実施し、結果を公表した。
② については、NDBに含まれる個人単位被保険者番号に基づく個人名寄せID(id5)が付与されたデータの長期追跡性について検討及び評価を行った。さらに、id5が付与される前のデータについても、既存のidとのより精緻なデータ連結の可能性について検討を行った。
③ については、今年度はNDBと介護DBの連結データの分析練習に使用可能なサンプルデータセットの仕様検討を行った。
④ については、実際のHICの利用を実施し、オンサイトリサーチセンターでのNDBデータ利用との比較検討を行った。
結果と考察
介護DBに格納されているデータに関する基礎データを集計し、コードブックを作成した。NDBデータと同様に介護DBデータについても、コードブックを作成、公開することにより、今後介護DBデータに関する利用者の理解が深まり、データ利活用の一助となることが期待される。
長期追跡可能なIDの検討においては、NDBデータにおいてはすでにid0を用いた1患者1データ化の手法が開発されており、NDBデータ内における追跡調査・コホート調査が可能となっている(2021年度報告書にて報告)。今年度はid5の設定状況を把握したとともに、id0およびid5の長期追跡の妥当性評価を行い、id0とid5を組み合わせた新たなid0nの開発に踏み込んだ。この取り組みにより、すでに蓄積されている膨大な過去データとの連結解析が可能になり、様々な課題に対するデータの有効利用が期待される。
データセットの検討においては、研究者のニーズに対応できるデータセット作成に必要な条件を同定するために、2021年度、2022年度において実際にいくつかのリサーチクエスチョンについてNDBデータおよび自治体医療介護データを用いた分析を実施した(報告済み)。その結果、学術研究に資するようなデータセットの作成には、研究内容に即したデータセットの設計が必要であり、レディメイドのデータセットでは研究内容に制限がある可能性が示唆された。一方で、データセットの基本構造(エンティティ定義)等については共有できる可能性が改めて示唆された。今年度はいままでの検討結果をふまえて、NDB・介護DB連結データの分析練習ができるデータセットの開発を行った。簡便に使用可能なサンプルデータセットにより、連結データ利用に対するハードルが下がり、利用推進が期待される。
HICの試行利用においては、実際のデータを用いて、HIC上に分析用データベース構築を行い、HIC利用における課題検討を行った。また、HICとオンサイトリサーチセンターとの比較検討を行い、その特性の違いを説明した。
長期追跡可能なIDの検討においては、NDBデータにおいてはすでにid0を用いた1患者1データ化の手法が開発されており、NDBデータ内における追跡調査・コホート調査が可能となっている(2021年度報告書にて報告)。今年度はid5の設定状況を把握したとともに、id0およびid5の長期追跡の妥当性評価を行い、id0とid5を組み合わせた新たなid0nの開発に踏み込んだ。この取り組みにより、すでに蓄積されている膨大な過去データとの連結解析が可能になり、様々な課題に対するデータの有効利用が期待される。
データセットの検討においては、研究者のニーズに対応できるデータセット作成に必要な条件を同定するために、2021年度、2022年度において実際にいくつかのリサーチクエスチョンについてNDBデータおよび自治体医療介護データを用いた分析を実施した(報告済み)。その結果、学術研究に資するようなデータセットの作成には、研究内容に即したデータセットの設計が必要であり、レディメイドのデータセットでは研究内容に制限がある可能性が示唆された。一方で、データセットの基本構造(エンティティ定義)等については共有できる可能性が改めて示唆された。今年度はいままでの検討結果をふまえて、NDB・介護DB連結データの分析練習ができるデータセットの開発を行った。簡便に使用可能なサンプルデータセットにより、連結データ利用に対するハードルが下がり、利用推進が期待される。
HICの試行利用においては、実際のデータを用いて、HIC上に分析用データベース構築を行い、HIC利用における課題検討を行った。また、HICとオンサイトリサーチセンターとの比較検討を行い、その特性の違いを説明した。
結論
NDBにおける長期追跡可能なidに関する評価を行った。またNDB・介護DB連結データの練習用データセットを開発した。さらにHICにおけるデータ分析に関する課題抽出および解決法の検討を行った。これらの成果は今後利用者支援の一環となることが期待される。
公開日・更新日
公開日
2024-07-01
更新日
-