ゲノムデータの持つ個人識別性に関する研究

文献情報

文献番号
201605001A
報告書区分
総括
研究課題名
ゲノムデータの持つ個人識別性に関する研究
課題番号
H28-特別-指定-001
研究年度
平成28(2016)年度
研究代表者(所属機関)
吉倉 廣(国立感染症研究所)
研究分担者(所属機関)
  • 佐藤 智晶(青山学院大学 法学部)
  • 荻島 創一(東北大学 東北メディカル・メガバンク機構)
  • 大澤 資樹(東海大学 医学部)
  • 徳永 勝士(東京大学 大学院医学系研究科)
  • 鎌谷 洋一郎(理化学研究所 統合生命医科学研究センター)
  • 竹内 史比古(国立国際医療研究センター 研究所)
  • 俣野 哲朗(国立感染症研究所 エイズ研究センター)
  • 後澤 乃扶子(国立研究開発法人国立がん研究センター 研究支援センター)
研究区分
厚生労働科学研究費補助金 行政政策研究分野 厚生労働科学特別研究
研究開始年度
平成28(2016)年度
研究終了予定年度
平成28(2016)年度
研究費
2,576,000円
研究者交替、所属機関変更
-

研究報告書(概要版)

研究目的
ゲノムデータの個人識別性に該当する範囲の検討
研究方法
ゲノムデータをベースとした分野の研究者、及び、その適正利用に関する国内外の議論の経験者を分担研究者とし、全員で検討した。これに基づいて作成された原案を全員で修文の上合意し、最終報告書を作成した。
結果と考察
ゲノム情報は、疾患頻度、個人或いは集団識別等に関係し、プライバシーに関係する。稀なゲノム配列は個人の特定性が高く、ありふれたゲノム配列は、個人の特定性は低い。しかし、それぞれの検出の可能性を考えると、前者は、一定サイズ以下の集団には存在しない可能性が高く、逆に、後者は、ゲノムデータ以外の情報があれば、それとの組み合わせにより個人の特定に至ることが可能である。
本報告書の主要な部分を占めるのは、ゲノム情報単独として、それ自体で特定個人に至るかどうかの条件の設定である。それを以下の様にまとめた。
(1)「個人識別性がほぼ確かと判断できる」レベル
全核ゲノムシークエンスデータ、全エクソームシークエンスデータ、全ゲノムSNPデータ、互いに独立な40以上のSNPから構成されるシークエンスデータ、STR9~10座位以上
(2)グレイゾーン
いずれにも該当せず、個別に専門家の判断を要するもの
(3)「個人識別性はほぼ無いと判断できる」レベル
30未満のSNP、がん細胞等の体細胞変異、
単一遺伝子疾患の原因遺伝子の(生殖細胞系列の)ホットスポット変異
注意点
レアバリアントの取扱い:レアバリアントは上記分類に含めず、別途取り扱うべきものと整理した。レアバリアントの中で、臨床的意義が明らかな希少性の高い難病等の原因変異については、他の情報との突合により容易に個人識別が可能なものとして、データの取扱には十分注意する必要がある。

ゲノム情報は、他の情報と完全に遮断されていたのでは、実用価値が非常に低い。そこで、生体材料・ゲノムデータ取得時に提供者の合意を得た上で、十分な匿名化を施せば原則自由に利用できるというのが、欧米の理解である。その手法としては、所定の事項(名前、住所、誕生日、電話・FAX・Eメールアドレス、社会保障番号、診療記録番号、社会保険受領者番号、銀行口座番号、資格等番号、自動車登録番号、医療機器番号、ウェブURL、IPアドレス、指紋・声紋、顔写真、その他個人識別コード)の除去、並びに、個人識別が最小化されていることの専門家による確認である。
OECDは、Creation and Governance of Human Genetic Research Databases (2006)、関連してBest Practice Guidelines on Human-Derived Material (2007)を、文部科学省・厚生労働省・経済産業省は「ヒトゲノム・遺伝子解析研究に関する倫理指針」を出しており、ゲノムデータの構築・使用に当たってはこれらの指針と整合性を保つ必要がある。
結論
ゲノム情報が公正に使用される為には、ゲノム情報自体の個人識別性の評価と共に、ゲノム情報と同時に取得し得る情報の適切な消去或いは遮断が必要である。

公開日・更新日

公開日
2017-09-06
更新日
-

研究報告書(PDF)

公開日・更新日

公開日
2017-09-06
更新日
-

研究報告書(紙媒体)

行政効果報告

文献番号
201605001C

収支報告書

文献番号
201605001Z