文献情報
文献番号
201803007A
報告書区分
総括
研究課題名
電子カルテ情報をセマンティクス(意味・内容)の標準化により分析可能なデータに変換するための研究
課題番号
H28-ICT-一般-007
研究年度
平成30(2018)年度
研究代表者(所属機関)
堀口 裕正(独立行政法人国立病院機構 本部 総合研究センター 診療情報分析部)
研究分担者(所属機関)
- 狩野 芳伸(静岡大学 情報学部 准教授)
- 森田 瑞樹(岡山大学 大学院医歯薬総合研究科 准教授)
- 奥村 貴史(北見工業大学 工学部・大学院工学研究科 教授)
- 岡田 千春(国立病院機構 本部 企画役)
研究区分
厚生労働科学研究費補助金 行政政策研究分野 政策科学総合研究(臨床研究等ICT基盤構築・人工知能実装研究)
研究開始年度
平成28(2016)年度
研究終了予定年度
平成30(2018)年度
研究費
14,400,000円
研究者交替、所属機関変更
所属機関異動
研究分担者 奥村 貴史
保健医療科学院( 平成30年4月1日~30年4月30日)→ 北見工業大学 工学部・大学院工学研究科 教授(平成30年5月1日以降)
研究報告書(概要版)
研究目的
本研究は、電子カルテに実装可能な医療用語の標準化を行うシステムの開発に向け、そのステップとして、臨床現場からのニーズが極めて大きい退院サマリの自動生成技術の実現を目標と定める。電子カルテの自動解析は技術的な難易度が高く、実用的な精度を実現するためには多額の研究開発投資が求められる。そこで、本研究提案では、医療現場に直接的なメリットが生じる研究課題に取り組むことによって、現場の協力と今後の追加的な研究開発投資を呼び込み、その過程を通じて実用性の高い電子カルテの自動解析技術を実現する戦略を採る。
研究方法
堀口・岡田が「部門システム化を目指したモジュール開発」の分担研究を担当、「退院サマリの自動生成に向けたアプローチの検討」というテーマの分担研究を奥村が、「退院サマリの自由記載文の特徴解析」というテーマの分担研究を森田が、「退院サマリの自動生成に向けたアプローチの検討」というテーマの分担研究を狩野が担当することとした。
結果と考察
研究代表者堀口及び分担研究者岡田は、他のため研究者の分析に資するため、国立病院機構本部との調整を中心としたセキュリティを維持しつつ、空間的制約をなるべく少なく研究が進められるような基盤構築・運用を行った。
また研究代表者堀口は、本研究の当初の目的である、汎用的にどの電子カルテからでも利用できるシステムの構築という課題に対して、JAHISのHL7CDA規約に基づくデータをSS―MIX拡張ストレージに保管するという現在日本における標準的なデータ交換フォーマットを起点として、特定の患者の医師記録を抽出し、そこからサマリを作成するフローを実現するモジュールの開発を行った。
研究分担者奥村は、入院カルテの自動要約に向けた研究基盤の整備に取り組んできた。
研究活動の結果、ダミーカルテは、目標を超える108件を集めることが出来た。また、これらのカルテを対象としたアノテーションを進めると共に、アノテーションガイドラインを高品質化することが出来た。さらに、このアノテーション済みカルテを用いて実現する退院サマリの分析に向けたモデルとして、修正CASEモデルを提示することが出来た。理想のサマリに向けた検討では、高品質な退院サマリを低コストに実現するための作業仮説を整理すると共に、実証に向けた研究デザインを策定することが出来た。
研究分担者森田は、退院サマリの自動生成技術の実現を目指し,昨年度までの調査結果の整理およびそれを踏まえた退院サマリの自動評価のコンセプト検証を実施した。退院サマリの記載に関して「記載すべき項目」および「定性的な要件事項」を抽出し,前者として38項目を得た。また,後者として9項目を得た。
研究分担者狩野は、退院サマリの自動生成に向けたテキストの分析についての研究を行った。
カルテの処理にあたっては、事前に匿名化が必要となる。匿名化作業を自動化するための匿名化ツールの実装と性能向上に取り組んだ。そのために、既存の正解付き模擬カルテデータに加え、別のダミーカルテデータセットに対し匿名化のためのアノテーション付与を行い、これらを用いてルールベースおよび機械学習による匿名化ツールの実装と性能検証を行った。
サマリ生成にあたっては、対象とするカルテやサマリのドメイン、すなわち診療科や疾患により、サマリ生成に必要となる情報が異なると考えられる。サマリと対応する電子カルテの履歴データについてクラスタリングを行い、どのようなタイプのサマリやカルテがどう類似しうるかの分析を行った。
また研究代表者堀口は、本研究の当初の目的である、汎用的にどの電子カルテからでも利用できるシステムの構築という課題に対して、JAHISのHL7CDA規約に基づくデータをSS―MIX拡張ストレージに保管するという現在日本における標準的なデータ交換フォーマットを起点として、特定の患者の医師記録を抽出し、そこからサマリを作成するフローを実現するモジュールの開発を行った。
研究分担者奥村は、入院カルテの自動要約に向けた研究基盤の整備に取り組んできた。
研究活動の結果、ダミーカルテは、目標を超える108件を集めることが出来た。また、これらのカルテを対象としたアノテーションを進めると共に、アノテーションガイドラインを高品質化することが出来た。さらに、このアノテーション済みカルテを用いて実現する退院サマリの分析に向けたモデルとして、修正CASEモデルを提示することが出来た。理想のサマリに向けた検討では、高品質な退院サマリを低コストに実現するための作業仮説を整理すると共に、実証に向けた研究デザインを策定することが出来た。
研究分担者森田は、退院サマリの自動生成技術の実現を目指し,昨年度までの調査結果の整理およびそれを踏まえた退院サマリの自動評価のコンセプト検証を実施した。退院サマリの記載に関して「記載すべき項目」および「定性的な要件事項」を抽出し,前者として38項目を得た。また,後者として9項目を得た。
研究分担者狩野は、退院サマリの自動生成に向けたテキストの分析についての研究を行った。
カルテの処理にあたっては、事前に匿名化が必要となる。匿名化作業を自動化するための匿名化ツールの実装と性能向上に取り組んだ。そのために、既存の正解付き模擬カルテデータに加え、別のダミーカルテデータセットに対し匿名化のためのアノテーション付与を行い、これらを用いてルールベースおよび機械学習による匿名化ツールの実装と性能検証を行った。
サマリ生成にあたっては、対象とするカルテやサマリのドメイン、すなわち診療科や疾患により、サマリ生成に必要となる情報が異なると考えられる。サマリと対応する電子カルテの履歴データについてクラスタリングを行い、どのようなタイプのサマリやカルテがどう類似しうるかの分析を行った。
結論
本今年度の研究においては、昨年度に引き続きサマリ作成についての各種技術の研究を着実に進めたとともに、本研究の当初の目的である、汎用的にどの電子カルテからでも利用できるシステムの構築という課題に対して、JAHISのHL7CDA規約に基づくデータをSS―MIX拡張ストレージに保管するという現在日本における標準的なデータ交換フォーマットを起点として、特定の患者の医師記録を抽出し、そこからサマリを作成するフローを実現するモジュールの開発を行った。SS-MIXストレージを活用したデータ保管システムはすでに国内の大手ベンダー8社においてはNCDA上で実現されており、横展開可能なシステムの構築という本研究に求められたミッションの1つは達成できたと考えている。
研究で作成した入院カルテ・退院サマリの高品質な個人情報を含まない模擬のデータセットは、研究成果として公表することにしており、電子カルテの現物を持たない情報系研究者が、容易に本領域の発展に貢献できる環境を提供出来る点も大きな成果になるものと考えている
研究で作成した入院カルテ・退院サマリの高品質な個人情報を含まない模擬のデータセットは、研究成果として公表することにしており、電子カルテの現物を持たない情報系研究者が、容易に本領域の発展に貢献できる環境を提供出来る点も大きな成果になるものと考えている
公開日・更新日
公開日
2019-11-15
更新日
-