電子カルテ情報をセマンティクス(意味・内容)の標準化により分析可能なデータに変換するための研究

文献情報

文献番号
201603011A
報告書区分
総括
研究課題名
電子カルテ情報をセマンティクス(意味・内容)の標準化により分析可能なデータに変換するための研究
課題番号
H28-ICT-一般-007
研究年度
平成28(2016)年度
研究代表者(所属機関)
堀口 裕正(独立行政法人国立病院機構 本部 総合研究センター 診療情報分析部)
研究分担者(所属機関)
  • 狩野 芳伸(静岡大学・情報学部)
  • 森田 瑞樹(岡山大学大学院・医歯薬学総合研究科)
  • 奥村 貴史(国立保健医療科学院・研究情報支援研究センター)
  • 岡田 千春(独立行政法人国立病院機構 本部)
研究区分
厚生労働科学研究費補助金 行政政策研究分野 政策科学総合研究(臨床研究等ICT基盤構築研究)
研究開始年度
平成28(2016)年度
研究終了予定年度
平成30(2018)年度
研究費
9,600,000円
研究者交替、所属機関変更
-

研究報告書(概要版)

研究目的
 本研究は、電子カルテに実装可能な医療用語の標準化を行うシステムの開発に向け、そのステップとして、臨床現場からのニーズが極めて大きい退院サマリの自動生成技術の実現を目標と定める。電子カルテの自動解析は技術的な難易度が高く、実用的な精度を実現するためには多額の研究開発投資が求められる。そこで、本研究提案では、医療現場に直接的なメリットが生じる研究課題に取り組むことによって、現場の協力と今後の追加的な研究開発投資を呼び込み、その過程を通じて実用性の高い電子カルテの自動解析技術を実現する戦略を採る。
研究方法
初年度においては、我々が日本語における医療用自然言語処理の研究コミュニティを形成し研究に取り組んで来た標準化技術を実カルテへと適用することで、カルテからの情報抽出の自動化に向けた予備的な検証を行うことを計画した。
結果と考察
研究代表者堀口及び分担研究者岡田は、国立病院機構本部との調整を中心とした基盤構築を行った。まず、NDCAデータの研究利用に向け、倫理審査申請に加えて、内部規定にて定められている内部委員会の調整を図った。また、閲覧・解析に特化した自然言語処理用の研究基盤の構築を行った。研究基盤の概念図は図に示したとおりで、セキュリティを維持しつつ、空間的制約をなるべく少なく研究が進められるようなものになっている。
 研究分担奥村は、臨床的なニーズを自然言語処理における個別技術へと橋渡しする役割を担った。具体的には、臨床医側より退院サマリの自動生成に求められる要件定義を進めるとともに、先行研究の整理を行い今後の研究アプローチの策定を行った。さらに、今後の研究に役立てられる入院カルテ・退院サマリの高品質な個人情報を含まない模擬のデータセットを構築した。
 研究分担狩野・森田は、上記の実データ・テスト用データ双方を活用し、自然言語処理の医療テキストへの適用を進めた。狩野は、時系列で蓄積してく入院カルテデータを対象として、既存の自然言語処理ツールによる処理性能と今後の改良に向けた課題抽出を図った。森田は、医師が要約した退院サマリデータを対象として、医師の記載する退院サマリの定量的・定性的な特徴の把握を図った。この知見は、今後、入院カルテの自動要約技術の研究に際した精度管理に役立てられる。
 今年度の研究においては、NDCAデータの利用に際した倫理審査の関係で、実カルテを対象とした解析は3月以降に限られる制約が生じた。しかしながら、高品質なテストデータの確保が可能であったことから、研究のコアである医療用自然言語処理部分の検討はほぼ計画通りに進めることが出来た。電子カルテの自由記載部分を自動解析する多施設構成での大規模データを対象とした研究としては、本邦初の試みとなろう
結論
医療用情報システムの研究開発においては、医療現場に直接の恩恵が及ばないゴールが設定されることで、研究開発が現場のニーズから乖離するとともに、継続した開発投資に繋がらない悪循環が往々にして生じてきた。本研究提案は、医療現場における負担軽減策として期待が大きい退院サマリの自動要約技術の開発を目指す。これにより、紹介状の自動作成技術等、電子カルテの自動解析技術に関連する継続的な研究開発投資の実現が期待される。この研究開発サイクルを確立することにより、要素技術である電子カルテ上の記載から自動情報抽出における継続的な精度向上が期待される。
こうして確立する医療用自然言語処理技術は、大量の電子カルテからの効率的な情報抽出を実現し、健康医療政策に資する統計データの収集コストを劇的に低廉化することが期待される。とりわけ、様々な傷病や治療に関して、既存のDPCやレセプトには表れてこない深遠な実態を明らかとし、医療の質向上・均てん化・各種医療技術の臨床開発に必要なエビデンスを生み出してくことが期待される。
 また、国立病院機構の有する広域電子カルテ網は、各病院が独自に調達した電子カルテベンダー主要6社を網羅している。本研究によって、大口顧客としての交渉力を背景としたこれら主要ベンダーへの研究開発成果の技術移転が期待される。これらは、医療の情報化を進める厚生労働行政にとって、新たな政策手段の実現をもたらす
 加えて、本研究で作成した入院カルテ・退院サマリの高品質な個人情報を含まない模擬のデータセットは、研究成果として公表することにしており、電子カルテの現物を持たない情報系研究者が、容易に本領域の発展に貢献できる環境を提供出来る点も大きな成果になるものと考えている。

公開日・更新日

公開日
2017-05-30
更新日
-

研究報告書(紙媒体)

収支報告書

文献番号
201603011Z