文献情報
文献番号
201803008A
報告書区分
総括
研究課題名
カルテ情報の自動構造化システムと疾患数理モデルの逐次的構築、及び、自動構造化機能を有した入力機構の開発
課題番号
H28-ICT-一般-008
研究年度
平成30(2018)年度
研究代表者(所属機関)
荒牧 英治(奈良先端科学技術大学院大学 研究推進機構)
研究分担者(所属機関)
- 若宮 翔子(奈良先端科学技術大学院大学 研究推進機構)
- 河添 悦昌(東京大学大学院医学系研究科 医療AI開発学講座 )
研究区分
厚生労働科学研究費補助金 行政政策研究分野 政策科学総合研究(臨床研究等ICT基盤構築・人工知能実装研究)
研究開始年度
平成28(2016)年度
研究終了予定年度
平成30(2018)年度
研究費
8,730,000円
研究者交替、所属機関変更
-
研究報告書(概要版)
研究目的
これまで,医療医学用語をまとめる試みは数々なされてきた.これらは主に医師・研究者などの医療者が使う用語を対象としており,電子カルテなど医療現場で扱う技術は向上しつつある.万病辞書もその辞書の一つであり,かつてない多くの用語を収載している.その一方で,近年増えつつある患者が記述したテキストを扱うためには十分な用語が収載されていない.
本研究はこれまで予定より早く医療用語のデータの収集が進んでおり,今後は,コストの許す限り人手による精査を進めていくのみが課題であると考えている.そこで最終年度である本研究は,当初の計画にはなかったこの患者表現をも一部収載しようと発展的な研究を行った.
本研究はこれまで予定より早く医療用語のデータの収集が進んでおり,今後は,コストの許す限り人手による精査を進めていくのみが課題であると考えている.そこで最終年度である本研究は,当初の計画にはなかったこの患者表現をも一部収載しようと発展的な研究を行った.
研究方法
1. 症状オノマトペの収集
前述したように患者表現が医学表現と異なる点は次の2つである.
・語彙的ギャップ:擬音語擬態語の頻用,特にオノマトペに代表される表現.
・構造的ギャップ:複合名詞である医学用語が動詞句として表現される.
これら2つの違いを考慮して,オノマトペに特化した収集方法と,クラウドソーシングを用いて動詞句を含んだ表現を募集する方法の2つを併用して表現を収集し,標準病名との対応をとる.以降,前者を症状オノマトペ,後者を症状句と呼称する.
2. 部位リストから部位+オノマトペ表現の自動収集
Google n-gramコーパスから「(部位)が(オノマトペ)する」という表現を収集する.
擬音語,擬態語はカタカナであるかどうかで判定する.人体部位は事前に作成した表1を用いた.
この結果,部位,オノマトペ,頻度の3つ組のリストが得られた.次に,これを精査し,不適切なものを除いたデータを構築した.
3. オノマトペ表現の標準化
次にオノマトペ表現がどのような医学表現に対応するかを人手により紐づけた.
医学表現としては,標準病名とし,部位+オノマトペのペアで標準病名との対応を得た.
4. 症状句の収集とその方法
オノマトペと異なり,句の表現の形式は「AのB」「AがBする」「AとBがCする」など様々であり,事前に形式を決める収集はできない. 患者表現を医学表現に紐付けるのではなく,逆に,医学表現を患者表現(形式は問わない)に言い換えることで収集を行った.医学表現としては<標準病名>を用い,クラウドソーシングにて収集した. 収集方法としては,クラウドソーシングでは万病辞書の表現形から,内科学会頻度が25以上のものを対象に100名にアンケートを実施した.
前述したように患者表現が医学表現と異なる点は次の2つである.
・語彙的ギャップ:擬音語擬態語の頻用,特にオノマトペに代表される表現.
・構造的ギャップ:複合名詞である医学用語が動詞句として表現される.
これら2つの違いを考慮して,オノマトペに特化した収集方法と,クラウドソーシングを用いて動詞句を含んだ表現を募集する方法の2つを併用して表現を収集し,標準病名との対応をとる.以降,前者を症状オノマトペ,後者を症状句と呼称する.
2. 部位リストから部位+オノマトペ表現の自動収集
Google n-gramコーパスから「(部位)が(オノマトペ)する」という表現を収集する.
擬音語,擬態語はカタカナであるかどうかで判定する.人体部位は事前に作成した表1を用いた.
この結果,部位,オノマトペ,頻度の3つ組のリストが得られた.次に,これを精査し,不適切なものを除いたデータを構築した.
3. オノマトペ表現の標準化
次にオノマトペ表現がどのような医学表現に対応するかを人手により紐づけた.
医学表現としては,標準病名とし,部位+オノマトペのペアで標準病名との対応を得た.
4. 症状句の収集とその方法
オノマトペと異なり,句の表現の形式は「AのB」「AがBする」「AとBがCする」など様々であり,事前に形式を決める収集はできない. 患者表現を医学表現に紐付けるのではなく,逆に,医学表現を患者表現(形式は問わない)に言い換えることで収集を行った.医学表現としては<標準病名>を用い,クラウドソーシングにて収集した. 収集方法としては,クラウドソーシングでは万病辞書の表現形から,内科学会頻度が25以上のものを対象に100名にアンケートを実施した.
結果と考察
評価の困難さ:
本研究では,オノマトペに注目した方法とクラウドソーシングを用いた方法という2つの方法により,患者症状表現の収集を行った.患者表現収集の大規模な試みの事例は研究代表者らの知る限りなく,また,既存のリソースもないため,結果の評価は困難である.
例えば,クラウドソーシングで症状の表現を収取して本リソースの網羅性を評価しようとしても,これはクラウドソーシングによる手法と同じことであり,同じデータを再現してしまうだけである.今後は,構築方法とともに評価方法を検討する必要がある.
応用可能性:
本研究は患者症状表現の収集を行った.患者表現収集の大規模な試みの事例は乏しく,どれくらいをカバーすれば全体の何%をカバーするのかも分からず,また,何が実現できるのかも分からない.評価方法とともに小規模な応用を繰り返しながら,検討することも有効であると考えている.潜在的な応用先は次のようなサービスを考えている:
(1)スマートフォンやスマートスピーカーを用いた患者症状の抽出.
患者が日常的に用いるデバイスに日々蓄積される自然文から,患者の症状の抽出を行い,想定外の有害事象やアンメットニーズの発見につなげる.
(2)待ち時間の問診票
病院の待ち時間などに患者に問診票を記載する際に,その自然文を解析し,カルテに転送するなど,病院業務の軽減につなげる.
(3)医療者-患者間コミュニケーション支援
患者表現と医療用語を結びつけた辞書により,患者と医療者の双方が,相手側の用語を知り,コミュニケーションを円滑にする教育効果が期待できる.
本研究では,オノマトペに注目した方法とクラウドソーシングを用いた方法という2つの方法により,患者症状表現の収集を行った.患者表現収集の大規模な試みの事例は研究代表者らの知る限りなく,また,既存のリソースもないため,結果の評価は困難である.
例えば,クラウドソーシングで症状の表現を収取して本リソースの網羅性を評価しようとしても,これはクラウドソーシングによる手法と同じことであり,同じデータを再現してしまうだけである.今後は,構築方法とともに評価方法を検討する必要がある.
応用可能性:
本研究は患者症状表現の収集を行った.患者表現収集の大規模な試みの事例は乏しく,どれくらいをカバーすれば全体の何%をカバーするのかも分からず,また,何が実現できるのかも分からない.評価方法とともに小規模な応用を繰り返しながら,検討することも有効であると考えている.潜在的な応用先は次のようなサービスを考えている:
(1)スマートフォンやスマートスピーカーを用いた患者症状の抽出.
患者が日常的に用いるデバイスに日々蓄積される自然文から,患者の症状の抽出を行い,想定外の有害事象やアンメットニーズの発見につなげる.
(2)待ち時間の問診票
病院の待ち時間などに患者に問診票を記載する際に,その自然文を解析し,カルテに転送するなど,病院業務の軽減につなげる.
(3)医療者-患者間コミュニケーション支援
患者表現と医療用語を結びつけた辞書により,患者と医療者の双方が,相手側の用語を知り,コミュニケーションを円滑にする教育効果が期待できる.
結論
本研究では,これまで大規模な収集が困難であった患者の症状表現の収集を行った.これは現在,ウェブ(http://sociocom.jp/~data/2019-pde/)にて公開している.
公開日・更新日
公開日
2019-11-15
更新日
-