文献情報
文献番号
202103016A
報告書区分
総括
研究課題名
新薬創出を加速する症例データベースの構築・拡充/創薬ターゲット推定アルゴリズムの開発
研究課題名(英字)
-
課題番号
21AC5001
研究年度
令和3(2021)年度
研究代表者(所属機関)
夏目 やよい(国立研究開発法人医薬基盤・健康・栄養研究所 AI健康・医薬研究センター バイオインフォマティクスプロジェクト)
研究分担者(所属機関)
- 小倉 高志(神奈川県立循環器呼吸器病センター)
- 高村 大也(国立研究開発法人産業技術総合研究所 人工知能研究センター)
- 西村 紳一郎(北海道大学 大学院先端生命科学研究院)
- 浜本 隆二(国立がん研究センター研究所)
- 奥野 恭史(京都大学 大学院医学研究科)
- 黒橋 禎夫(京都大学 情報学研究科)
- 荒牧 英治(奈良先端科学技術大学院大学 研究推進機構)
- 荒瀬 由紀(大阪大学 大学院情報科学研究科)
- 戸次 大介(お茶の水女子大学 基幹研究院自然科学系)
- 山西 芳裕(九州工業大学 大学院情報工学研究院)
- 田部井 靖生(理化学研究所 革新知能統合研究センター)
- 加藤 明良(大分大学 医学部)
- 佐藤 匠徳(Karydo TherapeutiX株式会社)
- 熊ノ郷 淳(大阪大学 大学院医学系研究科)
研究区分
厚生労働科学研究費補助金 行政政策研究分野 政策科学総合研究(臨床研究等ICT基盤構築・人工知能実装研究)
研究開始年度
令和3(2021)年度
研究終了予定年度
令和3(2021)年度
研究費
441,356,000円
研究者交替、所属機関変更
-
研究報告書(概要版)
研究目的
本事業では、「創薬ターゲットの枯渇問題」を克服すべく、患者の情報から創薬ターゲット分子を探索するAIの開発実装を目的とする。つまり、臨床情報(診療情報+オミックスデータ)を収集・利用して創薬ターゲットを探索するAI手法の開発を行う。対象疾患として難病指定のIPF(特発性肺線維症)及び部位別がん死亡者数1位である肺がんを選択した。
また、本事業で作成されるIPF及び肺がんの疾患統合データベース及びAIを多くの研究者等に利用してもらうための環境(オープンプラットフォーム)の構築を目指す。
また、本事業で作成されるIPF及び肺がんの疾患統合データベース及びAIを多くの研究者等に利用してもらうための環境(オープンプラットフォーム)の構築を目指す。
研究方法
(患者データの収集とAI解析のための処理)
IPFについては大阪大学医学部呼吸器・免疫内科及び神奈川循環器呼吸器疾患センターで、肺がんについては国立がん研究センターで診療情報及び検体を収集し、検体を用いてオミックス解析を実施する。
IPF及び肺がんの日本語医療テキストをAI解析に資するため、深層学習言語モデルBERTにより重要事象や事象間の関係を予測し、構造化する。
糖鎖構造から血中エクソソームの由来臓器/組織を推定するためにマウス主要臓器/組織の糖鎖構造を質量分析器を用いて定量的糖鎖プロファイリングを行った。
(創薬ターゲット探索のためのAI解析)
診療情報とオミックスデータを統合解析するため、理研AIPとの共同研究により開発された患者層別化AIを改良する他、様々な機械学習手法の開発を行う。
(AI解析結果の既存知識との照合及び検証)
特発性肺線維症に関する文献要旨データで構築したコーパスを学習・評価データセットに用いて、深層学習によるエンティティ抽出、関係抽出及びイベント抽出モデルの開発を行い、文献情報から疾患ネットワークを構築するためのツール開発を行う。また、文献情報とPoSSuM などの蛋白質に関するデータベースの基礎生物科学情報を利用し、疾患ネットワークの検証及び拡充を可能とする検索・推論基盤を構築する。
AI解析により抽出されたIPFに対する創薬ターゲット候補を、in vitro上皮間葉転換(EMT)試験及び患者の血中代謝物測定でその可能性を確認する。
(オープンプラットフォームの構築)
本事業成果である臨床情報データセットを産学の研究者に提供するため、国の定める基準に従って個人特定リスクの評価と匿名加工情報の作成を行なう。
また、本事業で作成されたAIをオープンプラットフォーム上で実行できるようにWebアプリケーション化を行う。
IPFについては大阪大学医学部呼吸器・免疫内科及び神奈川循環器呼吸器疾患センターで、肺がんについては国立がん研究センターで診療情報及び検体を収集し、検体を用いてオミックス解析を実施する。
IPF及び肺がんの日本語医療テキストをAI解析に資するため、深層学習言語モデルBERTにより重要事象や事象間の関係を予測し、構造化する。
糖鎖構造から血中エクソソームの由来臓器/組織を推定するためにマウス主要臓器/組織の糖鎖構造を質量分析器を用いて定量的糖鎖プロファイリングを行った。
(創薬ターゲット探索のためのAI解析)
診療情報とオミックスデータを統合解析するため、理研AIPとの共同研究により開発された患者層別化AIを改良する他、様々な機械学習手法の開発を行う。
(AI解析結果の既存知識との照合及び検証)
特発性肺線維症に関する文献要旨データで構築したコーパスを学習・評価データセットに用いて、深層学習によるエンティティ抽出、関係抽出及びイベント抽出モデルの開発を行い、文献情報から疾患ネットワークを構築するためのツール開発を行う。また、文献情報とPoSSuM などの蛋白質に関するデータベースの基礎生物科学情報を利用し、疾患ネットワークの検証及び拡充を可能とする検索・推論基盤を構築する。
AI解析により抽出されたIPFに対する創薬ターゲット候補を、in vitro上皮間葉転換(EMT)試験及び患者の血中代謝物測定でその可能性を確認する。
(オープンプラットフォームの構築)
本事業成果である臨床情報データセットを産学の研究者に提供するため、国の定める基準に従って個人特定リスクの評価と匿名加工情報の作成を行なう。
また、本事業で作成されたAIをオープンプラットフォーム上で実行できるようにWebアプリケーション化を行う。
結果と考察
(患者データの収集とAI解析のための処理)
肺がんで1,711症例、IPFで1,467症例の臨床情報を収集した。
日本語医療テキストの構造化については、症例報告においては十分医師の参考となるレベルの解析精度(F値69.8)を達成した。
マウス主要臓器/組織の定量的糖鎖プロファイリングにより、世界初の「マウス組織・臓器糖鎖アトラス」を作成した。さらにヒトへの展開を企図した。
(創薬ターゲット探索のためのAI解析)
肺がんにおいては、ロボットも活用して大規模なChIP-seq解析を施行した結果、pan-negative肺がんにおいて新規治療標的となる遺伝子の発現調整領域に、super-enhancerが形成されていることを突き止めた。
IPFにおいては、開発したAIを用いて、創薬ターゲット候補を絞り込んだ。
(AI解析結果の既存知識との照合及び検証)
基礎生物科学系文献からの分子/病態の知識抽出システム、疾患ネットワークの構築方法の開発、視覚化及びツール化を進めた。さらに、PoSSuMを利用した検索・推論基盤の構築に向けた準備を実施した。
大阪大学コホートの臨床情報から得られた創薬ターゲット候補を阻害する薬剤は、肺線維化において重要なEMTを濃度依存的に抑制した。さらに、本解析によって関与が示唆されたパスウェイの活性を検証するため、IPF患者の血液を用いたメタボローム解析を実施中。
(オープンプラットフォームの構築)
大阪大学から得られたIPFの臨床情報データセットについて、個人特定リスクの評価と匿名加工情報の作成及び9個のAIのWebアプリケーション化を行った。
また、バックアップシステム及びデータベースの高速化システムを導入するとともに、オープンプラットフォームの基幹技術の導入元である企業からのサポート体制を整備した。
肺がんで1,711症例、IPFで1,467症例の臨床情報を収集した。
日本語医療テキストの構造化については、症例報告においては十分医師の参考となるレベルの解析精度(F値69.8)を達成した。
マウス主要臓器/組織の定量的糖鎖プロファイリングにより、世界初の「マウス組織・臓器糖鎖アトラス」を作成した。さらにヒトへの展開を企図した。
(創薬ターゲット探索のためのAI解析)
肺がんにおいては、ロボットも活用して大規模なChIP-seq解析を施行した結果、pan-negative肺がんにおいて新規治療標的となる遺伝子の発現調整領域に、super-enhancerが形成されていることを突き止めた。
IPFにおいては、開発したAIを用いて、創薬ターゲット候補を絞り込んだ。
(AI解析結果の既存知識との照合及び検証)
基礎生物科学系文献からの分子/病態の知識抽出システム、疾患ネットワークの構築方法の開発、視覚化及びツール化を進めた。さらに、PoSSuMを利用した検索・推論基盤の構築に向けた準備を実施した。
大阪大学コホートの臨床情報から得られた創薬ターゲット候補を阻害する薬剤は、肺線維化において重要なEMTを濃度依存的に抑制した。さらに、本解析によって関与が示唆されたパスウェイの活性を検証するため、IPF患者の血液を用いたメタボローム解析を実施中。
(オープンプラットフォームの構築)
大阪大学から得られたIPFの臨床情報データセットについて、個人特定リスクの評価と匿名加工情報の作成及び9個のAIのWebアプリケーション化を行った。
また、バックアップシステム及びデータベースの高速化システムを導入するとともに、オープンプラットフォームの基幹技術の導入元である企業からのサポート体制を整備した。
結論
研究は、コロナ禍の影響により臨床情報の収集に遅延を生じたものの、全体的には概ね計画通りに進捗した。実際、IPF及び肺がんで各々1つ以上の創薬ターゲットを見出すという最終目標については、肺がんにおいては新規治療標的を1つ見出し、IPFにおいても創薬ターゲットの絞り込みが行われ、順調に進んでいる。
また、事業成果を産学の多くの研究者に提供するためのオープンプラットフォーム構築も予定通り進捗している。
また、事業成果を産学の多くの研究者に提供するためのオープンプラットフォーム構築も予定通り進捗している。
公開日・更新日
公開日
2025-05-02
更新日
-