新薬創出を加速する症例データベースの構築・拡充/創薬ターゲット推定アルゴリズムの開発

文献情報

文献番号
202103016A
報告書区分
総括
研究課題名
新薬創出を加速する症例データベースの構築・拡充/創薬ターゲット推定アルゴリズムの開発
研究課題名(英字)
-
課題番号
21AC5001
研究年度
令和3(2021)年度
研究代表者(所属機関)
夏目 やよい(国立研究開発法人医薬基盤・健康・栄養研究所 AI健康・医薬研究センター バイオインフォマティクスプロジェクト)
研究分担者(所属機関)
  • 小倉 高志(神奈川県立循環器呼吸器病センター)
  • 高村 大也(国立研究開発法人産業技術総合研究所 人工知能研究センター)
  • 西村 紳一郎(北海道大学 大学院先端生命科学研究院)
  • 浜本 隆二(国立がん研究センター研究所)
  • 奥野 恭史(京都大学 大学院医学研究科)
  • 黒橋 禎夫(京都大学 情報学研究科)
  • 荒牧 英治(奈良先端科学技術大学院大学 研究推進機構)
  • 荒瀬 由紀(大阪大学 大学院情報科学研究科)
  • 戸次 大介(お茶の水女子大学 基幹研究院自然科学系)
  • 山西 芳裕(九州工業大学 大学院情報工学研究院)
  • 田部井 靖生(理化学研究所 革新知能統合研究センター)
  • 加藤 明良(大分大学 医学部)
  • 佐藤 匠徳(Karydo TherapeutiX株式会社)
  • 熊ノ郷 淳(大阪大学 大学院医学系研究科)
研究区分
厚生労働科学研究費補助金 行政政策研究分野 政策科学総合研究(臨床研究等ICT基盤構築・人工知能実装研究)
研究開始年度
令和3(2021)年度
研究終了予定年度
令和3(2021)年度
研究費
441,356,000円
研究者交替、所属機関変更
-

研究報告書(概要版)

研究目的
本事業では、「創薬ターゲットの枯渇問題」を克服すべく、患者の情報から創薬ターゲット分子を探索するAIの開発実装を目的とする。つまり、臨床情報(診療情報+オミックスデータ)を収集・利用して創薬ターゲットを探索するAI手法の開発を行う。対象疾患として難病指定のIPF(特発性肺線維症)及び部位別がん死亡者数1位である肺がんを選択した。
また、本事業で作成されるIPF及び肺がんの疾患統合データベース及びAIを多くの研究者等に利用してもらうための環境(オープンプラットフォーム)の構築を目指す。
研究方法
(患者データの収集とAI解析のための処理)
IPFについては大阪大学医学部呼吸器・免疫内科及び神奈川循環器呼吸器疾患センターで、肺がんについては国立がん研究センターで診療情報及び検体を収集し、検体を用いてオミックス解析を実施する。
IPF及び肺がんの日本語医療テキストをAI解析に資するため、深層学習言語モデルBERTにより重要事象や事象間の関係を予測し、構造化する。
糖鎖構造から血中エクソソームの由来臓器/組織を推定するためにマウス主要臓器/組織の糖鎖構造を質量分析器を用いて定量的糖鎖プロファイリングを行った。
(創薬ターゲット探索のためのAI解析)
診療情報とオミックスデータを統合解析するため、理研AIPとの共同研究により開発された患者層別化AIを改良する他、様々な機械学習手法の開発を行う。
(AI解析結果の既存知識との照合及び検証)
特発性肺線維症に関する文献要旨データで構築したコーパスを学習・評価データセットに用いて、深層学習によるエンティティ抽出、関係抽出及びイベント抽出モデルの開発を行い、文献情報から疾患ネットワークを構築するためのツール開発を行う。また、文献情報とPoSSuM などの蛋白質に関するデータベースの基礎生物科学情報を利用し、疾患ネットワークの検証及び拡充を可能とする検索・推論基盤を構築する。
AI解析により抽出されたIPFに対する創薬ターゲット候補を、in vitro上皮間葉転換(EMT)試験及び患者の血中代謝物測定でその可能性を確認する。
(オープンプラットフォームの構築)
本事業成果である臨床情報データセットを産学の研究者に提供するため、国の定める基準に従って個人特定リスクの評価と匿名加工情報の作成を行なう。
また、本事業で作成されたAIをオープンプラットフォーム上で実行できるようにWebアプリケーション化を行う。
結果と考察
(患者データの収集とAI解析のための処理)
肺がんで1,711症例、IPFで1,467症例の臨床情報を収集した。
日本語医療テキストの構造化については、症例報告においては十分医師の参考となるレベルの解析精度(F値69.8)を達成した。
マウス主要臓器/組織の定量的糖鎖プロファイリングにより、世界初の「マウス組織・臓器糖鎖アトラス」を作成した。さらにヒトへの展開を企図した。
(創薬ターゲット探索のためのAI解析)
肺がんにおいては、ロボットも活用して大規模なChIP-seq解析を施行した結果、pan-negative肺がんにおいて新規治療標的となる遺伝子の発現調整領域に、super-enhancerが形成されていることを突き止めた。
IPFにおいては、開発したAIを用いて、創薬ターゲット候補を絞り込んだ。
(AI解析結果の既存知識との照合及び検証)
基礎生物科学系文献からの分子/病態の知識抽出システム、疾患ネットワークの構築方法の開発、視覚化及びツール化を進めた。さらに、PoSSuMを利用した検索・推論基盤の構築に向けた準備を実施した。
大阪大学コホートの臨床情報から得られた創薬ターゲット候補を阻害する薬剤は、肺線維化において重要なEMTを濃度依存的に抑制した。さらに、本解析によって関与が示唆されたパスウェイの活性を検証するため、IPF患者の血液を用いたメタボローム解析を実施中。
(オープンプラットフォームの構築)
大阪大学から得られたIPFの臨床情報データセットについて、個人特定リスクの評価と匿名加工情報の作成及び9個のAIのWebアプリケーション化を行った。
また、バックアップシステム及びデータベースの高速化システムを導入するとともに、オープンプラットフォームの基幹技術の導入元である企業からのサポート体制を整備した。
結論
研究は、コロナ禍の影響により臨床情報の収集に遅延を生じたものの、全体的には概ね計画通りに進捗した。実際、IPF及び肺がんで各々1つ以上の創薬ターゲットを見出すという最終目標については、肺がんにおいては新規治療標的を1つ見出し、IPFにおいても創薬ターゲットの絞り込みが行われ、順調に進んでいる。
また、事業成果を産学の多くの研究者に提供するためのオープンプラットフォーム構築も予定通り進捗している。

公開日・更新日

公開日
2025-05-02
更新日
-

研究報告書(PDF)

公開日・更新日

公開日
2024-02-29
更新日
-

研究報告書(紙媒体)

行政効果報告

文献番号
202103016C

成果

専門的・学術的観点からの成果
肺がんではTCGAデータベースに保存されている肺がん症例数である1,089を超える世界最大規模の1,711症例の、IPFでは疾患情報のデータベースとしては世界初となる1,467症例の疾患データベースを構築した。
このデータを解析する手法を開発し、肺がんでは新規治療ターゲットとなる遺伝子を突き止めた。IPFでは複数の創薬ターゲット候補を抽出し、そのターゲットとしての可能性を確認中である。
臨床的観点からの成果
肺がんで見出された新規治療ターゲットとなる遺伝子は、pan-negative肺がんで見出された。pan-negative肺がんは、ドライバ遺伝子が特定されてない、つまり治療薬が存在していない肺がんである。また、当該遺伝子に対しては、既に他の疾患で用いられている治療薬が存在するため、効果が確認されれば、患者さんに有望な治療薬を届けることができると思われる。
ガイドライン等の開発
該当なし
その他行政的観点からの成果
該当なし
その他のインパクト
シンポジウムについては、CBI学会2021年大会にて「国内AI創薬の最前線」と題したプレナリー講演(令和2年10月28日)及び令和2年度成果報告会(令和3年7月20日)を行った。
また、本事業成果を多くの産学の研究者に利用して頂くためオープンプラットフォームの構築を進め、掲載する事業成果の内、大阪大学コホートの臨床情報を匿名加工情報とし、9個のAIを Webアプリケーション化した。

発表件数

原著論文(和文)
4件
原著論文(英文等)
20件
その他論文(和文)
1件
その他論文(英文等)
66件
学会発表(国内学会)
75件
学会発表(国際学会等)
7件
その他成果(特許の出願)
5件
その他成果(特許の取得)
0件
その他成果(施策への反映)
0件
その他成果(普及・啓発活動)
1件
PRISM成果報告会

特許

特許の名称
複数の項目を関係付けるための方法、システム、及びプログラム
詳細情報
分類:
特許番号: 2022-003368
発明者名: 夏目やよい、上田修功
権利者名: 国立研究開発法人医薬基盤・健康・栄養研究所
出願年月日: 20220128
国内外の別: 国外
特許の名称
特発性肺線維症の治療または予防剤
詳細情報
分類:
特許番号: 2022-050865
発明者名: 夏目やよい、伊藤眞里、黒田正孝、水口賢司、足立淳、朝長毅、熊ノ郷淳、武田吉人、上田修功
権利者名: 国立研究開発法人医薬基盤・健康・栄養研究所 、国立大学法人大阪大学 、国立研究開発法人理化学研究所
出願年月日: 20220325
国内外の別: 国内
特許の名称
画像検索装置、方法及びプログラム
詳細情報
分類:
特許番号: 2021-010772
発明者名: 小林和馬, 三宅基隆, 浜本隆二
権利者名: 国立研究開発法人国立がん研究センター
出願年月日: 20210630
国内外の別: 国内
特許の名称
臨床テキスト情報時系列データ作製方法及び装置、並びに、臨床テキスト情報時系列可視化表示方法及び装置、並びに、臨床テキスト情報時系列可視化システム
詳細情報
分類:
特許番号: 2021-165067
発明者名: 矢田竣太郎,荒牧英治
権利者名: 国立大学法人奈良先端科学技術大学院大学
出願年月日: 20211006
国内外の別: 国内

主な原著論文20編(論文に厚生労働科学研究費の補助を受けたことが明記された論文に限る)

論文に厚生労働科学研究費の補助を受けたことが明記された論文に限ります。

原著論文1
Yayoi Natsume-Kitatani, Mari N Itoh, Yoshito Takeda et al.
Data-driven patient stratification and drug target discovery by using medical information and serum proteome data of idiopathic pulmonary fibrosis patients
Research Square  (2022)
10.21203/rs.3.rs-405195/v2
原著論文2
Koide R., Hirane N., Kambe D., et al
Antiadhesive nanosome elicits role of glycocalyx of tumor cell-derived exosomes in the organotropic cancer metastasis
Biomaterials , 280 , 123314-  (2022)
10.1016/j.biomaterials.2021.121314
原著論文3
Takahashi S, Takahashi M, Tanaka S, et al
A New Era of Neuro-Oncology Research Pioneered by Multi-Omics Analysis and Machine Learning
Biomolecules , 11 (4) , 565-  (2021)
10.3390/biom11040565
原著論文4
Kaneko S, Mitsuyama T, Shiraishi K, et al
Genome-Wide Chromatin Analysis of FFPE Tissues Using a Dual-Arm Robot with Clinical Potential
Cancers (Basel) , 13 (9) , 666397-  (2021)
10.3390/cancers13092126
原著論文5
Asada K, Kaneko S, Takasawa K, et al
Integrated Analysis of Whole Genome and Epigenome Data Using Machine Learning Technology: Toward the Establishment of Precision Oncology
Front Oncol , 12 (11) , 669397-  (2021)
10.3389/fonc.2021.666937
原著論文6
Kobayashi K, Miyake M, Takahashi M, et al
Observing Deep Radiomics for the Classification of Glioma Grades
Sci Rep , 11 (1) , 10942-  (2021)
10.1038/s41598-021-90555-2
原著論文7
Lee K, Kim K, Ryu TY, et al
Dysregulation of EHMT1 affects lung cancer proliferation by controlling CDKN1A expression
Mol Oncol , 15 (11) , 2989-3002  (2021)
10.1002/2F1878-0261.13050
原著論文8
Komatsu M, Sakai A, Dozen A, et al
Towards Clinical Application of Artificial Intelligence in Ultrasound Imaging
Biomedicines , 9 (7) , 720-  (2021)
10.3390/biomedicines9070720
原著論文9
Yamada M, Saito Y, Yamada S, et al
Detection of flat colorectal neoplasia by artificial intelligence: A systematic review
Best Pract Res Clin Gastroenterol , 52 (53) , 101745-  (2021)
10.1016/j.bpg.2021.101745
原著論文10
Kawaguchi RK, Takahashi M, Miyake M, et al
Assessing Versatile Machine Learning Models for Glioma Radiogenomic Studies across Hospitals
Cancers (Basel) , 13 (14) , 3611-  (2021)
10.3390/cancers13143611
原著論文11
Kobayashi K, Hataya R, Kurose Y, et al
Decomposing normal and abnormal features of medical images for content-based image retrieval of glioma imaging
Med Image Anal , 74 , 102227-  (2021)
10.1016/j.media.2021.102227
原著論文12
Kaneko S, Takasawa K, Asada K, et al
Epigenetic Mechanisms Underlying COVID-19 Pathogenesis
Biomedicines , 9 (9) , 1142-  (2021)
10.3390/biomedicines9091142
原著論文13
Asada K, Komatsu M, Shimoyama R, et al
Application of Artificial Intelligence in COVID-19 Diagnosis and Therapeutics
J Pers Med , 11 (9) , 886-  (2021)
10.3390/jpm11090886
原著論文14
Nakazawa MA, Tamada Y, Tanaka Y, et al
Novel cancer subtyping method based on patient-specific gene regulatory network
Scientific Reports , 11 , 23653-  (2021)
0.1038/s41598-021-02394-w
原著論文15
Faith Wavinya Mutinda, Shuntaro Yada, Shoko Wakamiya, et al
Semantic Textual Similarity in Japanese Clinical Domain Texts Using BERT
Methods of Information in Medicine , S (01) , e56-e64  (2021)
10.1055/s-0041-1731390
原著論文16
佐藤壮, 疋田正喜, 本田晴香,
創薬研究者・アカデミア研究者が知っておくべき 最新の免疫学とその応用技術
創薬研究者・アカデミア研究者が知っておくべき 最新の免疫学とその応用技術  (2021)
原著論文17
夏目やよい
新薬創出を加速する人工知能の開発 ~データ駆動型創薬ターゲット探索プラットフォームの構築~ 夏目やよい
あいみっく  (2021)
原著論文18
荒牧英治
自然言語処理の医療への応用
先進医療NAVIGATOR医療とAI最前線 新刊  (2021)
原著論文19
Ishida, Mana; Yanaka, Hitomi, et al
Compositional Semantics for Multiword Expression in Medical Case Retrieval
In Proceedings of the 18th International Workshop on Logic and Engineering of Natural Language Semantics (LENLS18) , 231-239  (2021)
原著論文20
Koba T, Takeda Y, Narumi R, et al
Proteomics of serum extracellular vesicles identifies a novel COPD biomarker, fibulin-3 from elastic fibres
ERJ Open Res , 7 (1) , 00658-  (2021)

公開日・更新日

公開日
2024-02-29
更新日
-

収支報告書

文献番号
202103016Z
報告年月日

収入

(1)補助金交付額
573,762,000円
(2)補助金確定額
572,256,146円
差引額 [(1)-(2)]
1,505,854円

支出

研究費 (内訳) 直接研究費 物品費 86,965,723円
人件費・謝金 168,878,848円
旅費 4,722,676円
その他 179,423,363円
間接経費 132,265,536円
合計 572,256,146円

備考

備考
-

公開日・更新日

公開日
2025-04-30
更新日
-