医療知識基盤にもとづく高度医療情報利活用に関する研究

文献情報

文献番号
201721033A
報告書区分
総括
研究課題名
医療知識基盤にもとづく高度医療情報利活用に関する研究
課題番号
H28-医療-指定-020
研究年度
平成29(2017)年度
研究代表者(所属機関)
大江 和彦(東京大学医学部附属病院 企画情報運営部)
研究分担者(所属機関)
  • 今井 健(東京大学 大学院医学系研究科)
  • 河添 悦昌(東京大学 医学部附属病院)
  • 古崎 晃司(大阪大学 産業科学研究所)
研究区分
厚生労働科学研究費補助金 健康安全確保総合研究分野 地域医療基盤開発推進研究
研究開始年度
平成28(2016)年度
研究終了予定年度
平成29(2017)年度
研究費
6,546,000円
研究者交替、所属機関変更
-

研究報告書(概要版)

研究目的
医療知識基盤データベース(以下MKB)は、疾患と異常状態(病態異常等)の因果関係により約6000疾患の定義が記述されたものである。本研究では①医療安全支援機能、②電子カルテDBやレセプトDB(NDBやDPC)(以下、既存DB)の研究利用のための高品質データ抽出機能、の2つをMKBを活用することで実現する。これにより今後の医用人工知能開発の基盤となることを目指す。
研究方法
本研究目的の2本の柱である医療安全支援機能の実現、研究支援機能実現のための均質的で構造的なデータベース生成のため、医療言語処理の解析基盤を開発する。
医療安全支援機能として、処方オーダ時に警告や注意喚起を表示する機能の実現に必要となる、主要な医薬品についての禁忌、投与注意、効能記述における疾患、病態、症状記述(以下、医薬品関連異常状態等)を抽出でき、MKBに記述されている異常状態表現と対応付けられる仕組みを開発する。また研究支援機能としては、MKBの異常状態表現を探索することで、疾患や検査結果、医薬品名そのものではなく、研究者が必要とする情報粒度でのデータ抽出を行う検索方法を開発する。
結果と考察
主要な言語辞書リソース17を用い、自然言語文リソースに対して文字列一致、形態素解析などにより汎用的かつ自動的にアノテーションする汎用システムMed-LexGridの開発を行った。本年度はJMed-LexGridのAPIを用いて複数の言語辞書リソースを横断的に検索し、上位/下位概念や意味カテゴリの再帰的な探索や同義関係の取得、代表表記への名寄せを行うことで、自然言語文に対する自動言語アノテーション情報に対してユーザーが求める粒度で意味的集約を行うことが可能だった。このように整備された医療言語リソースを利用して、入力として投入される添付文書言語情報を文字列一致、形態素解析により自動的にアノテーションする汎用システム「医学用語自動アノテーションシステム」を昨年度開発した。この精度を本年度はさらに改良した。これを用いて医薬品関連異常状態等をMKBの異常状態と対応づけられる用語を医薬品添付文書から抽出できる。また研究者が抽出したい情報粒度のやや大きい臨床概念を既存研究論文と研究計画書から収集できることを確認された。
結論
開発されたMed-LexGridは、国内17の言語リソースを集約した、医療自然言語処理を必要とする研究者やアプリケーションに非常に有用な言語リソースサービスとして提供できる。言語リソースを集約した、医療自然言語処理を必要とする研究者やアプリケーションに非常に有用な言語リソースサービスが開発され、医療安全支援機能を持った電子カルテや、電子カルテの文章データの二次利用システムに役立つと考えられる。

公開日・更新日

公開日
2021-11-16
更新日
-

研究報告書(紙媒体)

文献情報

文献番号
201721033B
報告書区分
総合
研究課題名
医療知識基盤にもとづく高度医療情報利活用に関する研究
課題番号
H28-医療-指定-020
研究年度
平成29(2017)年度
研究代表者(所属機関)
大江 和彦(東京大学医学部附属病院 企画情報運営部)
研究分担者(所属機関)
  • 今井 健(東京大学 大学院医学系研究科)
  • 河添 悦昌(東京大学 医学部附属病院)
  • 古崎 晃司(大阪大学 産業科学研究所)
研究区分
厚生労働科学研究費補助金 健康安全確保総合研究分野 地域医療基盤開発推進研究
研究開始年度
平成28(2016)年度
研究終了予定年度
平成29(2017)年度
研究者交替、所属機関変更
-

研究報告書(概要版)

研究目的
医療知識基盤データベース(以下MKB)は、疾患と異常状態(病態異常等)の因果関係により約6000疾患の定義が記述されたものである。本研究では①医療安全支援機能、②電子カルテDBやレセプトDB(NDBやDPC)(以下、既存DB)の研究利用のための高品質データ抽出機能、の2つをMKBを活用する方法を検討する。またそのために基盤として必要となる日本語医療言語リソースを集約統合して利用できる基盤の整備を行い、これにより今後の医用人工知能開発の基盤となることを目指す。
研究方法
医療安全支援機能として、処方オーダ時に警告や注意喚起を表示するシステムを試験開発できるようにするため、主要な医薬品について禁忌、投与注意、効能記述における疾患、病態、症状記述(以下、医薬品関連異常状態等)を抽出し、MKBに記述されている異常状態表現と対応付ける方法を開発した。また研究支援機能としては、MKBの異常状態表現を探索することで、疾患や検査結果、医薬品名そのものではなく、研究者が必要とする情報粒度でのデータ抽出を行う検索プログラムを開発した。初年度は医療自然言語処理リソースを集約し医用文書にメタ情報を付与できるツールを開発し、医薬品添付文書等に適用した。
結果と考察
医学用語自動アノテーションシステムの開発:
本研究だけでなく今後の多様な利用も可能となるよう、医療自然言語処理リソースを集約し医用文書にメタ情報を付与できるツールを開発し、これを研究支援機能の開発と共通で利用できるようにした。これを用いた医療安全支援機能と研究支援機能を設計し、一部のシステムモジュールを開発した。
具体的には、これまでの研究知見で得た言語リソースを標準病名、病名索引用語、病名修飾語、LiLakデータベース、薬剤JAPICコード、HOTマスター、WEB収集語、JLAC10用語、診療行為マスター、手術処置マスター、解剖学用語、MedDRA、日本医学会用語V3の全用語をひとつのWebリソースにまとめ、前記添付文書言語情報を文字列一致、形態素解析により自動的にアノテーションする汎用システム「医学用語自動アノテーションシステム」を開発した。これを用いて医薬品関連異常状態等をMKBの異常状態と対応づけられる用語を医薬品添付文書から抽出できる。また研究者が抽出したい情報粒度のやや大きい臨床概念を既存研究論文と研究計画書から収集できることを確認した。
言語アノテーション情報に対する意味的集約のためのシソーラス検索API: JMed-LexGridの開発
上述のように主要な言語辞書リソース17を用い、自然言語文リソースに対して文字列一致、形態素解析などにより汎用的かつ自動的にアノテーションする汎用システムの開発を行ったが、このシステムにてアノテーションされた言語素片タグに対し、複数の言語リソースにまたがり横断的に意味上の集約を行うためのシソーラス検索APIであるJMed-LexGridを開発した。
ここでは、全ての言語辞書リソースに共通した要素定義とメソッドを定義した。term2conceptIDsメソッドにより、用語文字列からその用語が存在する特定リソース内のテーブル名とテーブル内のIDのセットを得ることができる。
またconceptID2attributesメソッドにより、特定リソース内テーブルとIDを指定することで、(1) 他の標準コードセットとの対応(例: ICD10:2003)、(2)上位語の概念IDセット、(3)下位語の概念IDセット、(4)リソース内で定義された意味カテゴリ、(5)代表表記、(6)全同義語セット、(7)推論された意味カテゴリ、(8)その他の属性といった情報を取得することができる。
さらに、これらのメソッドを利用し上位・下位語や意味カテゴリ、IDコード、その他の情報を簡易的に取得するラッパーを用意し、JSONを用いたREST APIとして実装した。
このようなAPIを用いて複数の言語辞書リソースを横断的に検索し、上位/下位概念や意味カテゴリの再帰的な探索や同義関係の取得、代表表記への名寄せを行うことで、自然言語文に対する自動言語アノテーション情報に対してユーザーが求める粒度で意味的集約を行うことが可能である。
結論
開発されたJMed-LexGridと医学用語自動アノテーションシステムは、国内17の言語リソースを集約した、医療自然言語処理を必要とする研究者やアプリケーションに非常に有用な言語リソースサービスとして提供できる。言語リソースを集約した、医療自然言語処理を必要とする研究者やアプリケーションに非常に有用な言語リソースサービスが開発され、医療安全支援機能を持った電子カルテや、電子カルテの文章データの二次利用システムに役立つと考えられる。

公開日・更新日

公開日
2021-11-16
更新日
-

研究報告書(紙媒体)

行政効果報告

文献番号
201721033C

収支報告書

文献番号
201721033Z