top of page

AIが薬候補を見つける - DeepPurposeで加速する「分子×タンパク質」スクリーニング

最近、私たちが取り組んでいる話題として、DeepPurpose というオープンソースの薬剤スクリーニング AI ツールを使った研究があります。今回はこの DeepPurpose を用いて、ロングコロナに対する自然化合物のスクリーニングを行っている背景や意義についてご紹介します。


DeepPurposeとは何か?


DeepPurpose は、もともとハーバード大学、ジョージア工科大学、イリノイ大学アーバナ・シャンペーン校、およびIQVIAの研究者によってCOVID-19に対する薬剤候補を見つける目的で開発された、(注:一部の関連資料ではMITとの関係も指摘されていますが、公式論文ではMITの明記は確認されていません)Pythonベースの深層学習ライブラリです。薬の分子構造(SMILES 形式)と標的タンパク質のアミノ酸配列を入力として、結合予測(pIC50)を出力します。(https://academic.oup.com/bioinformatics/article/36/22-23/5545/6020256)

しかし、2020年以降の開発は停滞しており、当初の COVID-19 向け応用も中断されました。そこで私たちは、


  • タンパク質埋め込み層(ProtTrans)+PCA圧縮

  • リガンドに対するTransformer処理

  • 最新のCOVID向けDrug-Targetデータ(UC San Diego保管)を用いた再学習


といった近代的な層を追加して大きく改造し、DeepPurpose を COVID特化のスクリーニングAI として再構築しました。


なぜロングコロナと自然化合物なのか?


ロングコロナは、「慢性炎症」「神経炎症」「ミトコンドリア障害」など、COVIDウイルス残存や免疫異常に起因する多機能な症状を引き起こします。

西洋薬はこうした複雑な病態に対して「単一作用点」では十分に対応できない場合が多く、その点で多面的な作用を持つ自然由来の化合物(植物、菌類、海洋由来など)への注目が高まっています。

しかし、膨大な数の自然由来候補を1つずつ実験で評価するのは現実的ではありません。ここで AI の登場です。


DeepPurpose によるスクリーニングの流れ


以下の流れでスクリーニングを行います:


  1. 標的タンパク質のFASTA配列を収集(例:SARS-CoV-2 NSP群)

  2. ProtTrans で高次元ベクトルに変換し、PCAで圧縮(=埋め込み)

  3. 自然化合物のSMILESをPubChemなどから収集

  4. Transformerベースのリガンドエンコーダで変換

  5. DeepPurpose による予測実行(pIC50 → IC50換算)


これにより、さまざまな自然物が、どのSARS2タンパク質に対してどれほどの結合活性を持ちうるかが一覧化されます。


現時点での限界と展望


現在のモデルでは、あるリガンドが29種類のタンパク質すべてに対して「同一pIC50スコア」を出すケースが多く、タンパク質ごとの差分予測がやや苦手な傾向があります。

これは、


  • COVID関連のDrug-Target学習データがまだ少ない

  • モデルのタンパク質エンコーダが固定されている(事前学習層の転移)


といった理由によるものです。しかし、リガンド間の相対的な活性評価には十分な意味があり、大量の自然候補から「有望な10分の1」に絞る用途には非常に強力です。


今後の展望


現在、私たちはさらに多くの自然化合物(特にプレニル化フラボノイド、海洋ペプチドなど)をスクリーニング候補に追加し、複数リガンドのシナジー評価も視野に入れています。また、RNA修復やミトコンドリア保護作用が期待される物質群にも注目中です。

ロングコロナにおいては、「既存薬+自然由来スクリーニング+実験バリデーション」のトリプル戦略が今後の鍵になると私たちは考えています。

DeepPurpose 改良版を用いた私たちの取り組みは、その一端を担うものとして、今後も進展を報告していく予定です。

 
 
 

Comments


分析内容に関する質問などはこちらからどうぞ

Thanks for submitting!

© 2025 by Fukushima Diary srl. Proudly created with Wix.com

Angamareport

 コロナウイルス ミトコンドリア

bottom of page