新薬創出を加速する症例データベースの構築・拡充/創薬ターゲット推定アルゴリズムの開発

文献情報

文献番号
201903019A
報告書区分
総括
研究課題名
新薬創出を加速する症例データベースの構築・拡充/創薬ターゲット推定アルゴリズムの開発
研究課題名(英字)
-
課題番号
19AC5001
研究年度
令和1(2019)年度
研究代表者(所属機関)
国立研究開発法人医薬基盤・健康・栄養研究所(国立研究開発法人医薬基盤・健康・栄養研究所)
研究分担者(所属機関)
  • 水口 賢司(国立研究開発法人医薬基盤・健康・栄養研究所 AI健康・医薬研究センター)
  • 浜本 隆二(国立研究開発法人 国立がん研究センター研究所 がん分子修飾制御学分野)
  • 小倉 高志(地方独立行政法人 神奈川県立病院機構 神奈川県立循環器呼吸器病センター 呼吸器内科)
  • 熊ノ郷 淳(国立大学法人 大阪大学大学院医学系研究科 医学系研究科呼吸器・免疫内科学)
  • 西村 紳一郎(国立大学法人 北海道大学大学院 先端生命科学研究院・先端融合科学研究部門新薬探索研究分野)
  • 高村 大也(国立研究開発法人 産業技術総合研究所 人工知能研究センター・知能情報研究チーム)
  • 奥野 恭史(国立大学法人 京都大学 医学研究科人間健康科学系専攻)
  • 西岡 安彦(国立大学法人 徳島大学大学院医歯薬学研究部)
研究区分
厚生労働科学研究費補助金 行政政策研究分野 政策科学総合研究(臨床研究等ICT基盤構築・人工知能実装研究)
研究開始年度
令和1(2019)年度
研究終了予定年度
令和1(2019)年度
研究費
534,684,000円
研究者交替、所属機関変更
-

研究報告書(概要版)

研究目的
本事業では、「創薬ターゲットの枯渇問題」を克服すべく、ヒトの情報から創薬ターゲット分子を探索するAIの開発実装を目的とする。
診療情報とオミックスデータを収集・利用して創薬ターゲットを探索するAI手法の開発をおこなう。
難病指定のIPF(特発性肺繊維症)を含む間質性肺炎及び肺がんを選択し、これらの臨床情報収集と基盤構築、異種かつ大量のデータを統合して創薬ターゲット候補となる生体分子群を自動的に抽出するAIの開発を行う。また、IPF/肺がんの疾患統合データベース、機能分子を特定するためのAI及び知識ベース等をオープンプラットフォーム化することを目指す。
研究方法
1. 既知情報の収集と知識ベース化:公共・市販のデータベース(以下、DB)をTargetMineシステムに追加統合する。
2. 臨床情報の収集と機械可読表現の開発:国立がん研究センター(以下、NCC)では肺がん手術検体及び生検検体のオミックス解析を行い、大阪大学及び神奈川循環器呼吸器疾患センター(以下、神奈川循呼C)でIPFを含む間質性肺炎患者の臨床情報を収集した。収集された臨床情報は、疾患統合DBに順次格納する。当該DBに格納されたデータの統計量を表示する機能を実装する。
3. 統合データ解析の手法開発とそれを用いた新規創薬ターゲット候補の同定:プロトタイプを開発した患者層別化AIの改良をする。

結果と考察
1. 公共・市販DBの統合を完了した。論文から分子・病態に関する知識抽出を行うAI開発のために、産総研人工知能研究センター(以下、産総研)と共同で肺がん・基礎分子系要旨データ100件のエンティティアノテーションを行い、一貫性の確認・修正作業を実施した。IPF・基礎分子系要旨データに対して、生命現象イベントに関するアノテーション用ガイドラインを作成し、IPF・基礎分子系要旨データ121件に対してエンティティのアノテーションとノーマリゼーションIDにおける一貫性の確認を行った。イベントについても比較的シンプルなものに対してアノテーションを実施した。その結果、アノテーションに係る課題が明らかになり、肺疾患の専門家の意見を反映させた言語リソース構築を継続する必要がある。
2.NCCにおいて、全エクソーム解析及び診療情報に関しては521症例新たに肺がんDBに追加し、総計1569症例となり世界最大規模のDBとなり、診療情報を、ゲノム・エピゲノム情報と紐づけた統合DBを構築でき、また肺がんオミックス解析の新規アルゴリズムを4種類開発した。
大阪大学より、IPFを含む間質性肺炎および健常者(器質的な呼吸器疾患なし)について、血清 602症例を始めとし診療記録+基本情報 594症例等の臨床情報を取得した。大阪大学での臨床情報収集はほぼ完了し、患者層別化AIによる本解析を主軸としてデータ解析による知識抽出に注力する段階に到達した。
神奈川循呼Cより、血液 370名を始めとし肺組織82検体(生検及び手術)等の臨床情報を取得した。今後、間質性肺炎のどのような症例を重点的に収集するべきかを併行して検討しながら柔軟に対応する必要がある。
3. 大阪大学にて収集されたIPFを含む間質性肺炎患者363症例の診療情報及びそれを紐づけられたプロテオームデータを患者層別化AIに供したところ、「診療情報項目と紐づけられたタンパク質群」の出力を得、所期の動作をすることを確認した。全602症例データを用いた本解析では、TargetMineの多様な情報源からの情報検索・分析による結果解釈を実施する他、研究分担者の医師らによる結果解釈を取り入れることにより創薬標的探索に有益な情報を得られるものと期待される。


結論
1. TargetMineの拡充が順調のため、PoSSuM、MGeNDの追加統合のみを実施する。産総研人工知能研究センターについては、次年度に計画内容を完了するべく、言語リソース構築についても完了し、学習データとして利用可能な状態で産総研に提供する。
2. NCCにおける肺がんの組織を用いたマルチオミックス解析は、世界最大規模のDB構築を達成したことから、2020年度は欠損データの取得を実施する。
大阪大学におけるIPFを含む間質性肺炎の臨床情報収集は、2020年度に全602症例分の血清中エクソソームのプロテオームデータ及びそれと紐づけられた診療情報の収集で完了する。
神奈川循呼Cにて収集された肺組織を用いたマルチオミックスデータは、2020年度にプロセシング・解析を実施しつつ、引き続き肺組織・血液・診療情報の収集を継続する。
3. 患者層別化AIの改良により、臨床情報からデータ駆動的に患者層別化ルールを出力できたので、臨床情報の収集・構造化が完了次第、当該AIを用いた本解析を実施する。

公開日・更新日

公開日
2020-11-02
更新日
-

研究報告書(PDF)

公開日・更新日

公開日
2020-11-02
更新日
-

研究報告書(紙媒体)

行政効果報告

文献番号
201903019C

成果

専門的・学術的観点からの成果
患者層別化は、現在の医療、創薬において必須の課題と認識されているが、クラスタリングを中心とする従来の手法では、各患者に付随する多様な特徴量を統合的に取り扱って臨床的に意義ある分類を与えることは難しかった。今年度、現実の臨床データをAI解析可能な形に構造化し、新規に開発した患者層別化AIが事前知識なく期待される結果を出力できることを確認した。これは、患者層別化問題の解決、ひいてはそれに基づくターゲット推定への重要な一歩を達成したと考えられる。
臨床的観点からの成果
大規模データ解析を目的とし、将来のデータ共有・公開まで見据えて、臨床現場で継続的に検体及び情報を収集することには様々な困難が伴うが、今回AI解析可能な形でのデータ取得を目指して、実際に複数機関でデータ収集が進んだ意義は大きい。また、確定診断の情報を用いずに診療パラメータやオミックスデータのみから患者層別化AIの機能を確認できたことは、客観的な診断基準の導出や、今後の個別化医療をも含む、広汎な技術基盤の構築に繋がると期待される。
ガイドライン等の開発
該当なし
その他行政的観点からの成果
該当なし
その他のインパクト
シンポジウムについては、第2回メディカルAI学会にて「内閣府のメディカルAI研究戦略とその成果」と題したシンポジウム(令和2年2月1日)及びAI健康・医薬研究センターシンポジウム(令和2年2月3日:参加者総数288名)を行った。その他、講演11件行った。

発表件数

原著論文(和文)
1件
原著論文(英文等)
8件
その他論文(和文)
0件
その他論文(英文等)
0件
学会発表(国内学会)
0件
学会発表(国際学会等)
0件
その他成果(特許の出願)
1件
その他成果(特許の取得)
0件
その他成果(施策への反映)
0件
その他成果(普及・啓発活動)
0件

特許

特許の名称
特徴ネットワーク抽出装置、コンピュータプログラム、
詳細情報
分類:
特許番号: 特願 2020-002923
発明者名: 奥野恭史、玉田嘉紀
出願年月日: 20200110
国内外の別: 国内

主な原著論文20編(論文に厚生労働科学研究費の補助を受けたことが明記された論文に限る)

論文に厚生労働科学研究費の補助を受けたことが明記された論文に限ります。

原著論文1
Kiyoharu Fukushima , Takashi Satoh , Fuminori Sugihara et al.
Dysregulated Expression of the Nuclear Exosome Targeting Complex Component Rbm7 in Nonhematopoietic Cells Licenses the Development of Fibrosis
Immunity , 17 (52) , 542-556  (2020)
10.1016/j.immuni.2020.02.007.
原著論文2
Toshihiro Kishikawa, Yuichi Maeda, Takuro Nii et al.
Metagenome-wide association study of gut microbiome revealed novel aetiology of rheumatoid arthritis in the Japanese population
Ann Rheum Dis , 79 (1) , 103-111  (2020)
原著論文3
Soma O., Hatakeyama S., Yoneyama T et al.
“Serum N-glycanprofiling can predict biopsy-proven graft rejection after living kidney transplantation
Clin. Exp.Nephrol , 24 , 174-187  (2020)
原著論文4
Kobayashi K, Murakami N, Takahashi K et al.
A Population-basedStatistical Model for Investigating Heterogeneous Intraprostatic Sensitivity to Radiation Toxicity After125I Seed Implantation
In Vivo , 33 , 2103-2111  (2019)
原著論文5
Asada K, Kobayashi K, Joutard S et al.
A Population-basedStatistical Model for Investigating Heterogeneous Intraprostatic Sensitivity to Radiation Toxicity AfterUncovering Prognosis-related Genes and Pathways by Multi-omics Analysis in Lung Cancer
Biomolecules , 10 , 524-  (2020)
原著論文6
Hamamoto R, Komatsu M, Takasawa K et al.
Epigenetics Analysis and IntegratedAnalysis of Multiomics Data, Including Epigenetic Data, Using Artificial Intelligence in the Era of Precision Medicine
Biomolecules , 10 , 62-  (2020)
原著論文7
Isago, H, Mitani A, Mikami Y et al.
Epithelial Expression of YAP and TAZ Is Sequentially Required in Lung Development
Am J Respir Cell Mol Biol , 62 , 256-266  (2020)
原著論文8
Tanaka, Y., Tamada, Y., Ikeguchiet al.
System-based differential gene networkanalysis for characterizing a sample-specific subnetwork
Biomolecules , 10 (2) , 306-  (2020)

公開日・更新日

公開日
2021-07-14
更新日
2025-04-30

収支報告書

文献番号
201903019Z
報告年月日

収入

(1)補助金交付額
695,089,000円
(2)補助金確定額
694,956,000円
差引額 [(1)-(2)]
133,000円

支出

研究費 (内訳) 直接研究費 物品費 97,367,134円
人件費・謝金 50,707,862円
旅費 2,788,752円
その他 383,747,248円
間接経費 160,405,000円
合計 695,015,996円

備考

備考
5機関における自己資金合計59,996円が生じているため。

公開日・更新日

公開日
2025-04-30
更新日
-