文献情報
文献番号
201703007A
報告書区分
総括
研究課題名
電子カルテ情報をセマンティクス(意味・内容)の標準化により分析可能なデータに変換するための研究
課題番号
H28-ICT-一般-007
研究年度
平成29(2017)年度
研究代表者(所属機関)
堀口 裕正(独立行政法人国立病院機構 本部 総合研究センター 診療情報分析部)
研究分担者(所属機関)
- 狩野 芳伸(静岡大学・情報学部・准教授)
- 森田 瑞樹(岡山大学大学院・医歯薬学総合研究科・准教授)
- 奥村 貴史(国立保健医療科学院・研究情報支援研究センター・特命上席主任研究官)
- 岡田 千春(独立行政法人国立病院機構 本部)
研究区分
厚生労働科学研究費補助金 行政政策研究分野 政策科学総合研究(臨床研究等ICT基盤構築研究)
研究開始年度
平成28(2016)年度
研究終了予定年度
平成30(2018)年度
研究費
14,400,000円
研究者交替、所属機関変更
-
研究報告書(概要版)
研究目的
本研究では、電子カルテに実装可能な医療用語の標準化を行うシステムの開発に向け、そのステップとして、臨床現場からのニーズが極めて大きい退院サマリの自動生成技術の実現を目的とする。これは用語の標準化を目的とする研究として遠回りな課題設定である。しかし、電子カルテの自動解析は技術的な難易度が高く、実用的な精度を実現するためには多額の研究開発投資が求められる。そこで、本研究提案では、医療現場に直接的なメリットが生じる研究課題に取り組むことによって、現場の協力と今後の追加的な研究開発投資を呼び込み、その過程を通じて実用性の高い電子カルテの自動解析技術を実現する。
研究方法
本年度NCDAを用いて集積した電子カルテに及び、退院サマリデータを対象とした電子カルテの自動要約技術の検証を行う。平成28年度に構築した分析環境基盤を活用して、まずは、医師記録や検査データ等入院期間内に生成された情報と、退院サマリデータの差分の検証を行い、医師がどのような思考経路を経て情報処理を行い、文書を作成しているかについての検討を行う。その際、一般的な文章を対象とした自動要約技術の応用に加えて、医療文書を対象とする正規化技術を活用した疾患や病期毎のテンプレートを用いた情報抽出を試みる。
結果と考察
成果1 研究に利用するドキュメントの匿名化モジュールの開発
本研究班では前述のデータセットから、そのデータ仕様に基づいた匿名化モジュールの開発を行った。これは、実際のサマリ作成支援モジュール内では不要なものであるが研究を行う上で不可欠なものである。本年度、基本4情報を含む単独で個人情報とみなされる情報を削除するモジュールを開発し、そのモジュールを通過させた後に研究者に提供することとなった。
成果2 ダミーカルテの作成及びデータ量の拡充
本研究において,研究班員はNHOのデータを利用することができるが、データセットの公開は本研究では行うことができない。そのため、システムバリデーションやソフトウェア開発を促進するため、昨年度より空間や利用方法は制限のないが、本物と同様に取り扱えるダミーカルテの作成を行っている。本年度も引き続きカルテ数を増加させる作業を実施し,50件のダミーカルテデータを作成した。
成果3 「良い退院サマリとは何か」についての検討
ストラクチャーとしての退院サマリの標準化については退院時要約等の診療記録に関する3学会標準化推進合同委員会(POS医療学会,診療情報管理学会,医療情報学会)における検討が進んでおり、それを参考とすることにしている。また、いくつかの海外・国内の研究をレビューした上で、専門家や現場の臨床家のインタビューを実施している。また、本研究上におけるサマリの善し悪しを判断する医師のエキスパートオピニオンについては得られる体制を整備することとした。
成果4 サマリ生成方法に関するモデリングの検討
本領域のレビューの結果、入院サマリのサマリ作成のプロセスをモデル化したものとしてAORTIS modelというのが提言されている。そこから発展し、本研究では昨年度より入院カルテの自動要約に向けて、医師が作成する退院サマリの分析枠組みと自動的な退院サマリ生成モデルの双方を兼ね備えた、CASEモデルと証するモデルを構築した。
本研究班では前述のデータセットから、そのデータ仕様に基づいた匿名化モジュールの開発を行った。これは、実際のサマリ作成支援モジュール内では不要なものであるが研究を行う上で不可欠なものである。本年度、基本4情報を含む単独で個人情報とみなされる情報を削除するモジュールを開発し、そのモジュールを通過させた後に研究者に提供することとなった。
成果2 ダミーカルテの作成及びデータ量の拡充
本研究において,研究班員はNHOのデータを利用することができるが、データセットの公開は本研究では行うことができない。そのため、システムバリデーションやソフトウェア開発を促進するため、昨年度より空間や利用方法は制限のないが、本物と同様に取り扱えるダミーカルテの作成を行っている。本年度も引き続きカルテ数を増加させる作業を実施し,50件のダミーカルテデータを作成した。
成果3 「良い退院サマリとは何か」についての検討
ストラクチャーとしての退院サマリの標準化については退院時要約等の診療記録に関する3学会標準化推進合同委員会(POS医療学会,診療情報管理学会,医療情報学会)における検討が進んでおり、それを参考とすることにしている。また、いくつかの海外・国内の研究をレビューした上で、専門家や現場の臨床家のインタビューを実施している。また、本研究上におけるサマリの善し悪しを判断する医師のエキスパートオピニオンについては得られる体制を整備することとした。
成果4 サマリ生成方法に関するモデリングの検討
本領域のレビューの結果、入院サマリのサマリ作成のプロセスをモデル化したものとしてAORTIS modelというのが提言されている。そこから発展し、本研究では昨年度より入院カルテの自動要約に向けて、医師が作成する退院サマリの分析枠組みと自動的な退院サマリ生成モデルの双方を兼ね備えた、CASEモデルと証するモデルを構築した。
結論
本研究でチャレンジしている医療用自然言語処理技術は、大量の電子カルテからの効率的な情報抽出を実現し、健康医療政策に資する統計データの収集コストを劇的に低廉化することが期待される。とりわけ、様々な傷病や治療に関して、既存のDPCやレセプトには表れてこない深遠な実態を明らかとし、医療の質向上・均てん化・各種医療技術の臨床開発に必要なエビデンスを生み出してくことが期待される。
また、国立病院機構の有する広域電子カルテ網は、各病院が独自に調達した電子カルテベンダー主要6社を網羅している。本研究によって、大口顧客としての交渉力を背景としたこれら主要ベンダーへの研究開発成果の技術移転が期待される。これらは、医療の情報化を進める厚生労働行政にとって、新たな政策手段の実現をもたらす
加えて、本研究で作成した入院カルテ・退院サマリの高品質な個人情報を含まない模擬のデータセットは、研究成果として公表することにしており、電子カルテの現物を持たない情報系研究者が、容易に本領域の発展に貢献できる環境を提供出来る点も大きな成果になるものと考えている
また、国立病院機構の有する広域電子カルテ網は、各病院が独自に調達した電子カルテベンダー主要6社を網羅している。本研究によって、大口顧客としての交渉力を背景としたこれら主要ベンダーへの研究開発成果の技術移転が期待される。これらは、医療の情報化を進める厚生労働行政にとって、新たな政策手段の実現をもたらす
加えて、本研究で作成した入院カルテ・退院サマリの高品質な個人情報を含まない模擬のデータセットは、研究成果として公表することにしており、電子カルテの現物を持たない情報系研究者が、容易に本領域の発展に貢献できる環境を提供出来る点も大きな成果になるものと考えている
公開日・更新日
公開日
2018-10-24
更新日
-