文献情報
文献番号
202203019A
報告書区分
総括
研究課題名
新薬創出を加速する症例データベースの構築・拡充/創薬ターゲット推定アルゴリズムの開発
課題番号
22AC5001
研究年度
令和4(2022)年度
研究代表者(所属機関)
夏目 やよい(国立研究開発法人医薬基盤・健康・栄養研究所 AI健康・医薬研究センター バイオインフォマティクスプロジェクト)
研究分担者(所属機関)
- 小倉 高志(神奈川県立循環器呼吸器病センター呼吸器内科)
- 高村 大也(国立研究開発法人産業技術総合研究所 人工知能研究センター)
- 西村 紳一郎(北海道大学 大学院先端生命科学研究院)
- 浜本 隆二(国立がん研究センター研究所)
- 奥野 恭史(国立大学法人 京都大学 薬学研究科)
- 黒橋 禎夫(京都大学 情報学研究科)
- 荒牧 英治(奈良先端科学技術大学院大学)
- 荒瀬 由紀(大阪大学 大学院情報科学研究科)
- 戸次 大介(お茶の水女子大学 基幹研究院自然科学系)
- 山西 芳裕(九州工業大学 大学院情報工学研究院)
- 田部井 靖生(理化学研究所 革新知能統合研究センター)
- 加藤 明良(国立大学法人 大分大学 医学部)
- 佐藤 匠徳(Karydo TherapeutiX株式会社)
- 熊ノ郷 淳(大阪大学大学院医学系研究科 呼吸器免疫内科学)
- 永野 達也(神戸大学 大学院医学研究科)
研究区分
厚生労働科学研究費補助金 行政政策研究分野 政策科学総合研究(臨床研究等ICT基盤構築・人工知能実装研究)
研究開始年度
令和4(2022)年度
研究終了予定年度
令和4(2022)年度
研究費
441,356,000円
研究者交替、所属機関変更
-
研究報告書(概要版)
概要版(繰越課題)
研究の目的:
医薬品開発において、近年国内外を問わず創薬ターゲットの枯渇が問題となっている。現在残されているのは高難易度の創薬ターゲットであるがために、新薬の研究開発には多額の費用が必要となっており、これが高薬価、ひいては医療費の高騰の要因となっている。
さらに、臨床試験段階で期待していた薬効が得られず開発が中断する例が増えていることも問題点として挙げられる。特に医薬品開発の70〜80%がPhase2で中止となっており、この約60%が、薬効が得られなかったことが原因との報告がある。つまり、「動物では効くが、ヒトでは効かなかった」という事案が多発している。これは現在の創薬研究開発スキームの限界であると考えられる。
これらの現状を背景に、本事業では、「創薬ターゲットの枯渇問題」を克服すべく、動物からではなくヒトの情報から創薬ターゲット分子を探索するAIの開発実装を目的とする。つまり、臨床情報(=電子カルテを始めとする診療情報+オミックスデータ)を収集・利用して創薬ターゲットを探索するAI手法の開発をおこなう。対象疾患として難病指定のIPF(特発性肺線維症)を含む間質性肺炎及び部位別がん死亡者数1位である肺がんを選択し、これらの臨床情報収集とそれを支援する基盤構築、異種かつ大量のデータを統合して創薬ターゲット候補となる生体分子群を自動的に抽出するAI手法の開発を行う。
また、本事業で作成されるIPF/肺がんの疾患統合データベース、機能分子を特定するためのAI及び知識ベース等を多くの研究者等に利用してもらうための環境(オープンプラットフォーム)の構築を目指す。
研究結果の概要:
(患者データの収集とAI解析のための処理)
肺がん及びIPF患者の症例について、診療情報及びオミックスデータをそれぞれ累計1,741及び1,503症例を収集した。
収集した読影所見や電子カルテ等の臨床テキスト等を利用するため、それらを解析・構造化する言語・知識処理基盤を構築し、大規模なラベル無しの臨床テキスト等の構造化を実現した。
また、血中エクソソームのプロテオミクス解析を行っているが、その血中エクソソームの由来臓器を糖鎖解析により推定するため、マウス主要臓器・組織から抽出したエクソソームの定量的糖鎖プロファイリングによって得られた世界初の「マウス組織・臓器糖鎖アトラス」を完成した。これにより特定の組織・臓器や細胞から放出されるエクソソームは、主要な臓器や組織の糖鎖プロファイルデータベースとの相関を解析することによってその由来を推定できることが分かった。さらにヒト組織糖鎖アトラスへの展開を開始した。
(創薬ターゲット探索のためのAI解析)
肺がんにおいては、世界に先駆けて大規模なChIP-seq解析を施行した結果、pan-negative肺がんにおいて新規治療標的となる遺伝子の発現調整領域に、super-enhancerが形成されていることを突き止めた。
改良版患者層別化AI、ベイジアンネットワーク及び機械学習等の手法を用いてIPFのデータを解析し、これまでに肺線維症との関連が指摘されていない新規の創薬標的候補を見出した。また、肺と肝臓間の液性因子を介した臓器連関があることを見出した。さらに、IPFについては、今年度までに完成した神奈川県立循環器呼吸器病センターコホートのデータセットと解析フローにより、マルチオミックスデータの解析を本格的に開始した。
(AI解析結果の既存知識との照合及び検証)
膨大な英語文献から知識ベースを構築するアプリケーションを開発した。文献入力することで、事前に指定された情報が自動的に抽出され、疾患ネットワークを自動的に構築することができるウェブアプリケーションを実装した。結果は、2次元及び3次元で視覚化できるようになっているほか、ネットワークの構造をデータとしてダウンロードすることも可能になっている。
AI解析で出てきた創薬ターゲット候補については、既存知識等と照合し、絞り込みを行い、肺がんは患者の腫瘍を用いたPDXモデルで、IPFは患者の血清/尿中代謝物の網羅的測定、in vitro上皮間葉転換試験、in vivoブレオマイシンIPFモデル及び家族性IPF原因遺伝子導入モデルにより検証を行った。肺がん及びIPFで1つずつの創薬ターゲット候補がこれらの検証で著効を示した。また、他の創薬ターゲット候補についても疾病に関与している可能性を支持する結果が得られた。
(オープンプラットフォームの構築)
研究成果を企業やアカデミアと広く共有するための基盤として、オープンプラットフォーム「峰」の構築を進めてきたが、当該年度は新たに8個のAIをWebアプリケーション化し(累計19個)国内・国外で運用を開始した。ただし、匿名加工情報(診療情報)の搭載は当面見送る方針を固めた。
医薬品開発において、近年国内外を問わず創薬ターゲットの枯渇が問題となっている。現在残されているのは高難易度の創薬ターゲットであるがために、新薬の研究開発には多額の費用が必要となっており、これが高薬価、ひいては医療費の高騰の要因となっている。
さらに、臨床試験段階で期待していた薬効が得られず開発が中断する例が増えていることも問題点として挙げられる。特に医薬品開発の70〜80%がPhase2で中止となっており、この約60%が、薬効が得られなかったことが原因との報告がある。つまり、「動物では効くが、ヒトでは効かなかった」という事案が多発している。これは現在の創薬研究開発スキームの限界であると考えられる。
これらの現状を背景に、本事業では、「創薬ターゲットの枯渇問題」を克服すべく、動物からではなくヒトの情報から創薬ターゲット分子を探索するAIの開発実装を目的とする。つまり、臨床情報(=電子カルテを始めとする診療情報+オミックスデータ)を収集・利用して創薬ターゲットを探索するAI手法の開発をおこなう。対象疾患として難病指定のIPF(特発性肺線維症)を含む間質性肺炎及び部位別がん死亡者数1位である肺がんを選択し、これらの臨床情報収集とそれを支援する基盤構築、異種かつ大量のデータを統合して創薬ターゲット候補となる生体分子群を自動的に抽出するAI手法の開発を行う。
また、本事業で作成されるIPF/肺がんの疾患統合データベース、機能分子を特定するためのAI及び知識ベース等を多くの研究者等に利用してもらうための環境(オープンプラットフォーム)の構築を目指す。
研究結果の概要:
(患者データの収集とAI解析のための処理)
肺がん及びIPF患者の症例について、診療情報及びオミックスデータをそれぞれ累計1,741及び1,503症例を収集した。
収集した読影所見や電子カルテ等の臨床テキスト等を利用するため、それらを解析・構造化する言語・知識処理基盤を構築し、大規模なラベル無しの臨床テキスト等の構造化を実現した。
また、血中エクソソームのプロテオミクス解析を行っているが、その血中エクソソームの由来臓器を糖鎖解析により推定するため、マウス主要臓器・組織から抽出したエクソソームの定量的糖鎖プロファイリングによって得られた世界初の「マウス組織・臓器糖鎖アトラス」を完成した。これにより特定の組織・臓器や細胞から放出されるエクソソームは、主要な臓器や組織の糖鎖プロファイルデータベースとの相関を解析することによってその由来を推定できることが分かった。さらにヒト組織糖鎖アトラスへの展開を開始した。
(創薬ターゲット探索のためのAI解析)
肺がんにおいては、世界に先駆けて大規模なChIP-seq解析を施行した結果、pan-negative肺がんにおいて新規治療標的となる遺伝子の発現調整領域に、super-enhancerが形成されていることを突き止めた。
改良版患者層別化AI、ベイジアンネットワーク及び機械学習等の手法を用いてIPFのデータを解析し、これまでに肺線維症との関連が指摘されていない新規の創薬標的候補を見出した。また、肺と肝臓間の液性因子を介した臓器連関があることを見出した。さらに、IPFについては、今年度までに完成した神奈川県立循環器呼吸器病センターコホートのデータセットと解析フローにより、マルチオミックスデータの解析を本格的に開始した。
(AI解析結果の既存知識との照合及び検証)
膨大な英語文献から知識ベースを構築するアプリケーションを開発した。文献入力することで、事前に指定された情報が自動的に抽出され、疾患ネットワークを自動的に構築することができるウェブアプリケーションを実装した。結果は、2次元及び3次元で視覚化できるようになっているほか、ネットワークの構造をデータとしてダウンロードすることも可能になっている。
AI解析で出てきた創薬ターゲット候補については、既存知識等と照合し、絞り込みを行い、肺がんは患者の腫瘍を用いたPDXモデルで、IPFは患者の血清/尿中代謝物の網羅的測定、in vitro上皮間葉転換試験、in vivoブレオマイシンIPFモデル及び家族性IPF原因遺伝子導入モデルにより検証を行った。肺がん及びIPFで1つずつの創薬ターゲット候補がこれらの検証で著効を示した。また、他の創薬ターゲット候補についても疾病に関与している可能性を支持する結果が得られた。
(オープンプラットフォームの構築)
研究成果を企業やアカデミアと広く共有するための基盤として、オープンプラットフォーム「峰」の構築を進めてきたが、当該年度は新たに8個のAIをWebアプリケーション化し(累計19個)国内・国外で運用を開始した。ただし、匿名加工情報(診療情報)の搭載は当面見送る方針を固めた。
公開日・更新日
公開日
2023-07-24
更新日
-