カルテ情報の自動構造化システムと疾患数理モデルの逐次的構築、及び、自動構造化機能を有した入力機構の開発

文献情報

文献番号
201703008A
報告書区分
総括
研究課題名
カルテ情報の自動構造化システムと疾患数理モデルの逐次的構築、及び、自動構造化機能を有した入力機構の開発
課題番号
H28-ICT-一般-008
研究年度
平成29(2017)年度
研究代表者(所属機関)
荒牧 英治(奈良先端科学技術大学院大学 研究推進機構)
研究分担者(所属機関)
  • 若宮翔子(奈良先端科学技術大学院大学 研究推進機構)
  • 河添悦昌(東京大学医学部附属病院 企画情報運営部)
研究区分
厚生労働科学研究費補助金 行政政策研究分野 政策科学総合研究(臨床研究等ICT基盤構築研究)
研究開始年度
平成28(2016)年度
研究終了予定年度
平成30(2018)年度
研究費
8,500,000円
研究者交替、所属機関変更
-

研究報告書(概要版)

研究目的
電子カルテに自由記載された文章を対象に,これを二次利用可能な状態に自動変換する技術を確立することである.これを実現するために,現状の解析システムの解析精度を向上させ,これを多様かつ複雑な電子カルテシステムに組み込むことを目的とする.
研究方法
研究目的を達成するために,以下の3つのアイテムを開発することで,研究目的を達成する方針をとった.はじめに,汎用病名抽出器MedEX/Jの開発することで,電子カルテに自由記載された文章を二次利用可能な状態に自動変換するシステムを開発することを目指す.次に,MedEX/Jに利用する辞書「万病辞書」の精査することで,解析精度を高め,最後に,日本語入力パレットの開発することで臨床現場に適用可能なシステムを開発する.
結果と考察
下記に,研究結果と考察について述べる.

大規模病名辞書「万病辞書」,それを用いた解析器「MedEX/J」,さらに解析器を用いた入力ツールと,依存しつつ連続した成果を同時に開発している.それぞれ,研究分担者の若宮,代表者の荒牧が担当しており,同時に連携しながら開発が可能となっている.最終的に完成したツールを再び,研究分担者の河添が東京大学医学部附属病院のカルテに適用することにより,さらに「万病辞書」が拡充さえるという正のスパイラルを産んでいる.それぞれの状況は以下の通りである.

(1)汎用病名抽出器MedEX/Jの開発/配布/評価
本システムは,日本語の医療文章を解析し病名を抽出する.予備実験の結果,病名抽出においては形態素解析を用いず,いきなり文字そのものを処理する方式の方が高精度であることが分かり,この結果を受けて,形態素解析部を省くことで,よりコンパクトな解析器を構築できることになった.昨年度開発した本システムを,本年度は,C#での実装とし,インストールを簡便化し,速度を向上させた.評価の結果,精度はオリジナルと同等であったので,学会発表を行い,試験的に配布を行っている.
(2)MedEX/Jに利用する辞書「万病辞書」の精査
カルテ文章調査の結果,延べ45万症状表現(種類数としては6.2万種類)が得られ,その28.3%(種類数としては87.5%)が,標準病名でカバーされていないことが分かった.このうち高頻度(頻度30回出現の5,600病名)を扱い医療従事者3名によりコーディングを行い,意見が食い違ったものはその曖昧性も残したまま辞書リソース化した(通称「万病辞書」).この万病辞書により,現在すでにカルテに出現する80%の症状/病名を標準病名に変換可能である.昨年度,自動コード付与した部分について,本年度は3名の作業者が目視にチェックを行い,2万病名について精査した.
(3)日本語入力パレットの開発
日本語入力パレット(通常のIMEを用いて入力を行うと標準病名に変換した結果がサジェストされる)を開発した.今後は医療現場において, 電子カルテへの病名入力などの際に本システムを活用していく予定である.
結論
「万病辞書」はすでに仮公開しているが,今後,正式公開に向けて精査を続ける予定である.他のリソースも「万病辞書」に続き,公開する.本研究で開発した汎用病名抽出器MedEX/Jは,辞書リソースを用いているために今後の拡張性が高いため,多くの医療現場や分野に応用できる柔軟性を備えている.今後は改良を重ねつつ,多くの臨床現場で試用されることが期待される.

公開日・更新日

公開日
2018-09-12
更新日
-

研究報告書(PDF)

公開日・更新日

公開日
2018-09-12
更新日
-

研究報告書(紙媒体)

収支報告書

文献番号
201703008Z