文献情報
文献番号
201903004A
報告書区分
総括
研究課題名
人工知能を活用した副作用症例報告の評価支援の基盤整備と試行的評価
課題番号
H29-ICT-一般-005
研究年度
令和1(2019)年度
研究代表者(所属機関)
今任 拓也(国立がん研究センター 社会と健康研究センター)
研究分担者(所属機関)
- 潮田 明(国立研究開発法人 産業技術総合研究所 人工知能研究センター)
- 森谷 純治(独立行政法人医薬品医療機器総合機構 医薬品安全対策第一部)
- 相原 道子(横浜市立大学 医学研究科)
- 斎藤 嘉朗(国立医薬品食品衛生研究所 医薬安全科学部)
研究区分
厚生労働科学研究費補助金 行政政策研究分野 政策科学総合研究(臨床研究等ICT基盤構築・人工知能実装研究)
研究開始年度
平成29(2017)年度
研究終了予定年度
令和1(2019)年度
研究費
14,685,000円
研究者交替、所属機関変更
所属機関異動
研究代表者 今任拓也
国立医薬品食品衛生研究所( 令和元年4月1日~令和元年12月31日)→ 国立がん研究センター(令和2年1月1日以降)
研究報告書(概要版)
研究目的
本研究は、診断基準が比較的明確であり、致死性の高い副作用であるスティーブンス・ジョンソン症候群(SJS)および中毒性表皮壊死融解症(TEN)を対象とし、PMDAにおいて管理されている副作用個別症例報告を用いて、近年、医療を始めとした様々な分野で注目されている人工知能技術を応用し、副作用判定評価システムの構築のための試行的評価を実施した。前年度は、副作用判定に人工知能を応用するための基盤整備に先行し、まず、人手により素性を付与した副作用判定の試行的評価を実施したため、今年度は、主に基盤整備を実施し、改めて、全行程を通じた副作用判定の試行的評価を行うこととした。
研究方法
PMDAにて管理されている副作用個別症例報告書(SJS:1410件、TEN:200件)のテキストデータを用いた。素性抽出のためのトレーニングデータの作成には、brat(brat rapid annotation tool)を用い、アノテーション作業を行った。前年度の副作用自動判定の評価に用いたSJSの副作用個別症例報告書200件はテスト用データとして用い、残りの1410件のうち、981件を学習用データ、429件をバリデーションデータとして用いた。素性アノテーション用学習モデルには、SJSに関連する論文を含む広範囲にわたる医学雑誌の論文、JAPIC が提供する医薬品添付文書および独自開発の自動検索装置によりWEBから収集された医療分野のテキストからなる総計6千万文の日本文テキストを用いてBert用pretrainedモデルを構築して用いた。最後に、全行程を通した副作用判定の精度評価は、前年度と同様に、素性の評価が容易なMaximum Entropy Classifier(MEC)を用いて5分割交差検証により行った。
結果と考察
自動アノテーションについては、O-tagを含むすべてのタグ付けのテストデータの精度は96.5%、O-tagを除いた精度は69.4%であった。また、この自動アノテーションの結果をもとに副作用自動判定を行った結果、81.5%の判定精度が得られた。前年度に実施した素性を人手で付与した場合の副作用自動判定の精度は86.0%であったのに対し、今年度に実施した自動アノテーションの結果をもとにした副作用自動判定の結果では、4.5%低下したが、これは当初の目標としていた80%の精度を上回る結果となった。今回得られた結果は、安心して使用できるレベルではないと考えられ、さらに精度を上げるためには、今回の研究では捉えきれていない特徴を考慮すること、また、副作用個別症例報告書の記載内容の記載者によるぶれを減らすなど、報告書の形式についても検討していく必要があると考えられる。また、副作用自動判定システムの構築には、それぞれの副作用の判定に適した特徴量の抽出が今後の課題であると考えられる。
結論
3名の専門員の副作用判定精度の概算値が80%~90%であったことから、専門家の精度領域に近い結果が得られた。
公開日・更新日
公開日
2020-11-02
更新日
-