文献情報
文献番号
201302002A
報告書区分
総括
研究課題名
ICD11オミックスサブ情報モデル(iCOs)の妥当性に関する実証研究
課題番号
H24-統計-一般-004
研究年度
平成25(2013)年度
研究代表者(所属機関)
中谷 純(東北大学 大学院医学系研究科)
研究分担者(所属機関)
- 田中 博(東京医科歯科大学 難治疾患研究所生命情報学・生命情報)
- 今井 健(東京大学 医学部付属病院 企画情報運営部)
研究区分
厚生労働科学研究費補助金 行政政策研究分野 政策科学総合研究(統計情報総合研究)
研究開始年度
平成24(2012)年度
研究終了予定年度
平成25(2013)年度
研究費
1,700,000円
研究者交替、所属機関変更
-
研究報告書(概要版)
研究目的
本研究ではWHO-ICD11改訂に資するため、ICD11のコンテンツモデルに組み込むことのできるICD11オミックスサブ情報モデル(iCOs)の妥当性と性能に関する実証的検討を、東京医科歯科大学網羅的疾患分子病態データベース iCOD などの臨床オミックスデータベースの臨床オミックス実データ、NCKなどのオントロジー実データを用いて行うことを目的とする。本年度は平成24年度の成果に基づき、上記実データを用いたデータベース構築を行い、提案方式の妥当性並びに限界性能について検証を行った。
研究方法
昨年度、拡張を行ったICD11オミックスサブ情報モデル(ICD11 Omics Subinformation model: iCOs) をデータベース構築のためのモデルとし、東京医科歯科大学の統合的臨床オミックスデータベース(Integrated Clinical Omics Database: iCOD)を検証用の実データとして用いた。iCODは、統合データベースプロジェクトの一環として構築され、肝胆膵外科、大腸外科、及び口腔外科に入院した患者約400名を対象に、カルテから収集した病歴、診断、検査、外科的治療、内科的治療、予後の情報、及び看護師が聞き取った生活習慣情報と、病理標本よりレーザダイセクションで切り出した患部における網羅的遺伝子発現情報を集積したものである。全体で34個のテーブルからなるリレーショナルデータベースとして構成されている。本研究では実データをiCOsモデルで格納しデータベース構築を行うが、目的はモデルの限界性能の検証であるため、各患者の症例の詳細内容を直接用いる訳ではない。そこでiCODに対して連結不可能匿名化を施した上で、類似ダミーデータに置換した結果を借用し研究を行った。次にiCOsモデルで実データを格納し、多施設の臨床オミックスデータベースを構築する上での課題を検討した。iCOsはデータの関係を記述した情報モデルでありデータベーススキーマではない。実際には患者数が膨大になった場合の格納方法、ICD11やNCKといった静的な外部知識と動的に追加・変更される患者情報の切り分けの問題など、実データ格納上の検討課題があり、それら技術的要請に対する解決方針を定めた。最後に上記解決方針に基づき、iCOD実データをiCOs形式のXMLに変換し、データベースを構築した。また構築されたデータベースに対し、臨床オミックス研究で必要と考えられる検索の可否について検討を行った。
結果と考察
昨年度に拡張を行ったICD11オミックスサブ情報モデル(ICD11 Omics Sub information model: iCOs) に基づき、東京医科歯科大学統合的臨床オミックスデータベース iCODの実データを格納する際の課題を明らかにし、解決方針に従って実データベースを構築した。結果、(1) SS-MIX2と親和性の高いデータベース全体構造の導入、(2) 外部知識と患者臨床情報の分離、(3) Reference-IDを用いた複雑な参照構造の表現、(4) 共通参照レイヤーと各DB固有の名前空間の分離、といった工夫により、実データを問題なく格納できることを確認した。
結論
本研究の方式により構築された臨床オミックス研究データベースは、多施設間の情報共有・交換のための中間ストレージとして機能し、共通参照レイヤーの情報粒度で横断的な検索が可能である。また個々の患者臨床データの情報項目は、iCOsモデルを通じて対応するICD11エンティティと対応づけられており、ICD11のコンテンツモデルで記述された疾患特性 (一般的医学知識) と相互に参照することが可能である。今後は、より細かい情報粒度での検索クエリの実現のため、RDFデータベース上でのSPARQLクエリの利用とOWLレイヤーでのメタ情報記述の組み込みを検討する予定である。
公開日・更新日
公開日
2015-06-02
更新日
-