新薬創出を加速する症例データベースの構築・拡充/創薬ターゲット推定アルゴリズムの開発

文献情報

文献番号
201903019A
報告書区分
総括
研究課題名
新薬創出を加速する症例データベースの構築・拡充/創薬ターゲット推定アルゴリズムの開発
課題番号
19AC5001
研究年度
令和1(2019)年度
研究代表者(所属機関)
国立研究開発法人医薬基盤・健康・栄養研究所(国立研究開発法人医薬基盤・健康・栄養研究所)
研究分担者(所属機関)
  • 水口 賢司(国立研究開発法人医薬基盤・健康・栄養研究所 AI健康・医薬研究センター)
  • 浜本 隆二(国立研究開発法人 国立がん研究センター研究所 がん分子修飾制御学分野)
  • 小倉 高志(地方独立行政法人 神奈川県立病院機構 神奈川県立循環器呼吸器病センター 呼吸器内科)
  • 熊ノ郷 淳(国立大学法人 大阪大学大学院医学系研究科 医学系研究科呼吸器・免疫内科学)
  • 西村 紳一郎(国立大学法人 北海道大学大学院 先端生命科学研究院・先端融合科学研究部門新薬探索研究分野)
  • 高村 大也(国立研究開発法人 産業技術総合研究所 人工知能研究センター・知能情報研究チーム)
  • 奥野 恭史(国立大学法人 京都大学 医学研究科人間健康科学系専攻)
  • 西岡 安彦(国立大学法人 徳島大学大学院医歯薬学研究部)
研究区分
厚生労働科学研究費補助金 行政政策研究分野 政策科学総合研究(臨床研究等ICT基盤構築・人工知能実装研究)
研究開始年度
令和1(2019)年度
研究終了予定年度
令和1(2019)年度
研究費
534,684,000円
研究者交替、所属機関変更
-

研究報告書(概要版)

研究目的
本事業では、「創薬ターゲットの枯渇問題」を克服すべく、ヒトの情報から創薬ターゲット分子を探索するAIの開発実装を目的とする。
診療情報とオミックスデータを収集・利用して創薬ターゲットを探索するAI手法の開発をおこなう。
難病指定のIPF(特発性肺繊維症)を含む間質性肺炎及び肺がんを選択し、これらの臨床情報収集と基盤構築、異種かつ大量のデータを統合して創薬ターゲット候補となる生体分子群を自動的に抽出するAIの開発を行う。また、IPF/肺がんの疾患統合データベース、機能分子を特定するためのAI及び知識ベース等をオープンプラットフォーム化することを目指す。
研究方法
1. 既知情報の収集と知識ベース化:公共・市販のデータベース(以下、DB)をTargetMineシステムに追加統合する。
2. 臨床情報の収集と機械可読表現の開発:国立がん研究センター(以下、NCC)では肺がん手術検体及び生検検体のオミックス解析を行い、大阪大学及び神奈川循環器呼吸器疾患センター(以下、神奈川循呼C)でIPFを含む間質性肺炎患者の臨床情報を収集した。収集された臨床情報は、疾患統合DBに順次格納する。当該DBに格納されたデータの統計量を表示する機能を実装する。
3. 統合データ解析の手法開発とそれを用いた新規創薬ターゲット候補の同定:プロトタイプを開発した患者層別化AIの改良をする。

結果と考察
1. 公共・市販DBの統合を完了した。論文から分子・病態に関する知識抽出を行うAI開発のために、産総研人工知能研究センター(以下、産総研)と共同で肺がん・基礎分子系要旨データ100件のエンティティアノテーションを行い、一貫性の確認・修正作業を実施した。IPF・基礎分子系要旨データに対して、生命現象イベントに関するアノテーション用ガイドラインを作成し、IPF・基礎分子系要旨データ121件に対してエンティティのアノテーションとノーマリゼーションIDにおける一貫性の確認を行った。イベントについても比較的シンプルなものに対してアノテーションを実施した。その結果、アノテーションに係る課題が明らかになり、肺疾患の専門家の意見を反映させた言語リソース構築を継続する必要がある。
2.NCCにおいて、全エクソーム解析及び診療情報に関しては521症例新たに肺がんDBに追加し、総計1569症例となり世界最大規模のDBとなり、診療情報を、ゲノム・エピゲノム情報と紐づけた統合DBを構築でき、また肺がんオミックス解析の新規アルゴリズムを4種類開発した。
大阪大学より、IPFを含む間質性肺炎および健常者(器質的な呼吸器疾患なし)について、血清 602症例を始めとし診療記録+基本情報 594症例等の臨床情報を取得した。大阪大学での臨床情報収集はほぼ完了し、患者層別化AIによる本解析を主軸としてデータ解析による知識抽出に注力する段階に到達した。
神奈川循呼Cより、血液 370名を始めとし肺組織82検体(生検及び手術)等の臨床情報を取得した。今後、間質性肺炎のどのような症例を重点的に収集するべきかを併行して検討しながら柔軟に対応する必要がある。
3. 大阪大学にて収集されたIPFを含む間質性肺炎患者363症例の診療情報及びそれを紐づけられたプロテオームデータを患者層別化AIに供したところ、「診療情報項目と紐づけられたタンパク質群」の出力を得、所期の動作をすることを確認した。全602症例データを用いた本解析では、TargetMineの多様な情報源からの情報検索・分析による結果解釈を実施する他、研究分担者の医師らによる結果解釈を取り入れることにより創薬標的探索に有益な情報を得られるものと期待される。


結論
1. TargetMineの拡充が順調のため、PoSSuM、MGeNDの追加統合のみを実施する。産総研人工知能研究センターについては、次年度に計画内容を完了するべく、言語リソース構築についても完了し、学習データとして利用可能な状態で産総研に提供する。
2. NCCにおける肺がんの組織を用いたマルチオミックス解析は、世界最大規模のDB構築を達成したことから、2020年度は欠損データの取得を実施する。
大阪大学におけるIPFを含む間質性肺炎の臨床情報収集は、2020年度に全602症例分の血清中エクソソームのプロテオームデータ及びそれと紐づけられた診療情報の収集で完了する。
神奈川循呼Cにて収集された肺組織を用いたマルチオミックスデータは、2020年度にプロセシング・解析を実施しつつ、引き続き肺組織・血液・診療情報の収集を継続する。
3. 患者層別化AIの改良により、臨床情報からデータ駆動的に患者層別化ルールを出力できたので、臨床情報の収集・構造化が完了次第、当該AIを用いた本解析を実施する。

公開日・更新日

公開日
2020-11-02
更新日
-

研究報告書(PDF)

公開日・更新日

公開日
2020-11-02
更新日
-

研究報告書(紙媒体)

行政効果報告

文献番号
201903019C

収支報告書

文献番号
201903019Z