テキストマイニングによる薬物有害事象の自動抽出を目的としたオントロジー構築とシステム開発

文献情報

文献番号
200634106A
報告書区分
総括
研究課題名
テキストマイニングによる薬物有害事象の自動抽出を目的としたオントロジー構築とシステム開発
課題番号
H18-医療-一般-027
研究年度
平成18(2006)年度
研究代表者(所属機関)
金子 周司(京都大学大学院 薬学研究科)
研究分担者(所属機関)
  • 奥野 恭史(京都大学大学院 薬学研究科)
研究区分
厚生労働科学研究費補助金 健康安全確保総合研究 医療安全・医療技術評価総合研究
研究開始年度
平成18(2006)年度
研究終了予定年度
平成20(2008)年度
研究費
7,000,000円
研究者交替、所属機関変更
-

研究報告書(概要版)

研究目的
本研究は,ゲノム科学における情報科学的手法として発展・応用されつつあるテキストマイニング技術を医薬品の副作用(有害事象)のレポートや医療情報の解析に最適化し,日本語と英語を網羅する医療関連の用語オントロジーをテキスト解析エンジンに実装して,その評価を行いつつ,実効性のある情報解析システムを開発することによって,IT時代を迎える医療における効率良く確かな安全体制の実現を,情報技術的に支援することを目的とした。
研究方法
本研究では,ライフサイエンス辞書(LSD)に収録されている名詞のうち,病名/症候名,薬物/生体内分子名,解剖/発生部位名,生物名,方法や研究技術を意味する約4万語の対訳について,用語の同義性や上下関係を整理し,既存の専門用語シソーラスであるMeSHとリレーショナルデータベースで関連づけた。また,公開されている病名分類(ICD-10準拠標準病名マスターおよびICH国際医薬用語集MedDRA/J)や薬効分類(WHO ATCおよびMeSH Pharmacological Actions)へのリンクを設けることでLSDに意味と拡張性を付与し,新しい用語を補充した。
結果と考察
約9万語の専門用語をツリー状に整理した3万語の見出し語に割り当てたLSDシソーラスを完成させた。次にこれを応用するため,専門領域の英語テキストにシソーラス収録の日本語対訳タグを付与し,WWWブラウザで視認性良く閲覧できるようにするPerlスクリプトを開発した。さらに,大量の英文テキスト中での用語の共起関係を数値化することによって共起キーワードを収集した。このLSDシソーラスを利用したテキスト処理は,医療文書からの有害事象の検出をはじめとして関係抽出に応用できる優れた手法になると考えられる。
結論
本研究によって,医薬品と疾患,症状に加えて,関連する技術や方法,解剖部位や生物名までを網羅した頑強なシソーラス辞書がほぼ完成した。また,英語テキストについて文中でのキーワード共起解析を高速かつ簡便に行うための処理プログラムを開発し,テキストマイニングからデータマイニングへの橋渡しが可能であることを示した。今後はさらに解析結果のフィードバックからシソーラス辞書の網羅性を高めると共に,共起解析の結果を二項関係から関連性の記述へ発展させることで医療・生命科学オントロジーの構築に向けて発展させることが期待される。また,日本語解析プログラムの開発を行い,実際の医療文書の解析と評価を繰り返すことによって,十分な実用性と有用性を有する医療情報システム設計が可能になると結論できる。

公開日・更新日

公開日
2007-08-08
更新日
-