全国がん登録情報の利用及び提供における情報の特性と安全管理措置に関する研究

文献情報

文献番号
202307041A
報告書区分
総括
研究課題名
全国がん登録情報の利用及び提供における情報の特性と安全管理措置に関する研究
課題番号
23EA1032
研究年度
令和5(2023)年度
研究代表者(所属機関)
藤下 真奈美(国立がん研究センター がん対策研究所がん登録センター全国がん登録室)
研究分担者(所属機関)
  • 榊原 直喜(国立研究開発法人 国立がん研究センター がん対策研究所)
  • 東 尚弘(国立大学法人 東京大学大学院 医学系研究科公衆衛生学分野)
  • 伊藤 伸介(中央大学 経済学部)
  • 岩隈 道洋(中央大学 国際情報学部)
  • 上原 哲太郎(立命館大学 情報理工学部)
  • 大木 いずみ(埼玉県立大学 保健医療福祉学部 健康開発学科)
  • 佐藤 一郎(国立情報学研究所 情報社会相関研究系)
  • 高橋 克巳(国立情報学研究所 オープンサイエンス基盤研究センター)
  • 南 和宏(統計数理研究所 データ科学研究系)
研究区分
厚生労働科学研究費補助金 疾病・障害対策研究分野 がん対策推進総合研究
研究開始年度
令和5(2023)年度
研究終了予定年度
令和7(2025)年度
研究費
15,385,000円
研究者交替、所属機関変更
-

研究報告書(概要版)

研究目的
本研究は、全国がん登録情報の利用及び提供における運用実績から課題を抽出し、情報の特性に応じて講じるべき安全管理措置の検討を行い、全国がん登録を取り巻く環境の変化等を踏まえた、全国がん登録 情報の提供マニュアルの改訂案を提案することにより、今後の全国がん登録情報の利活用促進に資することを目的とする。
研究方法
①現状の把握及び課題の抽出
a)情報提供窓口における課題の抽出
全国がん登録の提供申出における安全管理措置の検討を含め、現行の全国がん登録 情報の提供マニュアルの安全管理措置の運用面における課題、問題点、改善点について整理した。
b)関連する研究班の研究成果を踏まえた課題の抽出
「全国がん登録の円滑な運用のための検証に関する研究」(20EA0701)等の研究成果から、差分プライバシーの手法を使った技術的な検討を行い、データ加工の手法等について整理した。
c)データの安全性に関する国内外の知見と対策事例の収集
海外におけるデータの安全性評価について、海外の公的統計及び医療健康情報の二次利用の最新状況について情報収集を行ったほか、リモートアクセスやオンサイト解析等の一部の課題把握のため、国内の関連機関から情報収集を行った。
②情報の特性に応じた安全管理措置の検討
a)匿名性の強度、情報の特性に合わせた安全管理措置のあり方の検討
①で抽出した課題及び解決に向けた提案について検討し、現行の提供マニュアルにおける安全管理措置の変更案の検討を行い、匿名性の強度に応じた安全管理措置の検討を行った。
b)物理的及び技術的安全管理措置の見直し
先行研究における匿名化情報の安全性評価の検討状況や、他のデータの知見を踏まえ、情報の特性に応じた安全管理措置、対策について見直し、物理的安全管理措置の適切な緩和及び利便性の向上について検討を行った。 また、全国がん登録情報等の提供及び利用を行うための、リモートアクセスの実現可能性と求められる安全管理措置についての検討を行った。
結果と考察
①現状の把握及び課題の抽出
a)情報提供窓口における課題の抽出
全国がん登録情報等の情報提供窓口における申出から審議、提供、利用、公表それぞれにおける課題を抽出し、整理した。
b)関連する研究班の研究成果を踏まえた課題の抽出
選択できるサンプリング率の上限値を下げても、同程度の安全性を維持しつつ、データの有用性が向上することが確認できた。データサイズが大きいがん登録情報の場合、低いプライバシー予算εを設定による強い安全性強度とデータの有用性保持が両立可能であることが示された。
c)データの安全性に関する国内外の知見と対策事例の収集
国内では、全国健康保険協会、総務省関連の統計センターから情報収集を行ったほか、国内の医療システムにおける事故の報告書を元に検討し、がん登録データの利用をリモートで行うためにはVPN機器の管理がセキュリティ上重要であることが示唆された。
国外では、統計作成部局、研究機関等から、公的統計、行政記録情報、医療健康データの二次利用に関して、学術研究目的に対する公的統計の個票データ、行政記録情報と医療健康データの利用サービスの現状及び技術的な安全管理措置に関する最新の専門的知見を得ることができた。
②情報の特性に応じた安全管理措置の検討
a)匿名性の強度、情報の特性に合わせた安全管理措置のあり方の検討
個人識別情報を削除しても、提供される情報の内容によっては、個人の同定が可能になるため、プライバシー保護については特に匿名化情報の秘匿について知見が必要となることを意識する必要がある。
b)物理的及び技術的安全管理措置の見直し
データの利用及び提供にあたり、データ管理者の管理下にある解析サーバに対して、利用者がオンサイトあるいはリモートでアクセスして解析をするという方法が、管理強化の観点からも有用と考えられた。

全国がん登録のデータ利用におけるプライバシー保護については慎重に検討し、利活用促進とのバランスで考える必要がある。全国がん登録のデータ利用におけるプライバシー保護については慎重に検討し、利活用促進とのバランスで考える必要がある。
結論
全国がん登録情報等の提供における安全管理措置の課題、問題点、改善すべき点について整理・検討した。
ランダムサンプリングは匿名データの安全性強度を高める手法として有望であり、レコード数が多いがん登録情報の場合、低いサンプリング率による情報損失が相対的に少なく、安全性と有用性の両立の可能性を示すことができた。また、国内外の関係機関から収集した情報は、わが国におけるリモートアクセスの運用可能性や分析結果のチェック方法・基準等の検討に資すると考えられた。

公開日・更新日

公開日
2024-06-06
更新日
-

研究報告書(PDF)

公開日・更新日

公開日
2024-05-31
更新日
-

研究報告書(紙媒体)

収支報告書

文献番号
202307041Z