|
生物学者が50年間解決できなかった問題がAIによって突然解決された? DeepMindは米国時間11月30日、 AIを活用して遺伝子配列に基づいてタンパク質の3D構造を予測するシステム「AlphaFold」のリリースを発表した。 国際タンパク質構造予測コンペティション(CASP)において、AlphaFoldシステムは第14回CASP評価において、平均総合スコア92.4 GDTを達成し、他の参加者を凌駕しました。GDT(Global Distance Test)は、CASPが予測精度を測定するために使用する主要な指標であり、0から100の範囲で評価されます。 DeepMindは、重要な「タンパク質折り畳み問題」を解決し、その計算時間を数ヶ月から数時間に短縮したと発表しました。これは創薬を大幅に加速させ、ヒトゲノムのマッピングに匹敵する問題を解く可能性を秘めています。 ディープマインドCEOのデミス・ハサビス氏は電話インタビューで、「これらのアルゴリズムは、科学的問題の解決に適用できるほど強力になっています。4年間の開発を経て、生物学研究者にとって実用的な生物学的意義と関連性を持つほどの精度を備えたシステムが完成しました」と述べた。ハサビス氏はまた、ディープマインドが現在、科学者に「スケーラブルな方法」でアルファフォールドシステムへのアクセスを提供する方法を模索していることも明らかにした。 DeepMind の成果は多くの業界専門家から賞賛を集めただけでなく、Nature 誌も「これはすべてを変えるだろう」と述べる記事を掲載しました。ディープマインドはこれまで、チェス、囲碁、スタークラフトII、そしてAtariのクラシックゲームで人間のプレイヤーに勝利してきました。今回は、学術界に直接挑戦したのです。 私たちは皆、生きた細胞の中に何千種類もの異なるタンパク質が存在し、タンパク質の折り畳みの程度の違いがそれぞれの機能を決定することを知っています。したがって、タンパク質構造の変化を予測できれば、がんなどの難病を克服する上で人類にとって画期的な意義を持つでしょう。 しかし、タンパク質の折り畳みを正確に予測することは、過去 50 年間生物学者にとっての課題でした。 これにはタンパク質の構成を説明する必要があります。DNAを例に挙げましょう。DNAは4つの塩基で構成されています。これらの4つの塩基は転写と翻訳によって64個のコドンを生成します。これらの64個のコドンは20種類以上のアミノ酸に対応しています。アミノ酸の配列と組み合わせによって、数万から数億種類もの異なるタンパク質が構成されます。しかし、アミノ酸の種類や数だけでなく、アミノ酸の立体構造もタンパク質の様々な機能を決定する上で重要な役割を果たしています。 理論的には、DNA配列がわかれば、アミノ酸配列とタンパク質の構造をプロットすることができますが、そのような予測を行うための計算上の困難さは想像を絶するものです。 1969年という早い時期に、サイラス・レビンサルは、タンパク質のあらゆる構造を総当たり計算で列挙すると、宇宙の年齢よりも長い時間がかかるだろうと指摘しました。レビンサルは、タンパク質には約10の300乗通りの構造があると推定しましたが、自然界ではタンパク質は自発的に折り畳まれ、中にはわずか数ミリ秒で折り畳まれるものもあります。 2018年、DeepMindチームはAlphaFoldの初期バージョンを使用してCASP13コンペティションに参加し、最高精度を達成しました。その後、DeepMindはCASP13の手法と関連コードをNature誌に発表しました。 今日、DeepMind チームは新しいディープラーニング アーキテクチャを使用して CASP14 への競争を継続し、92.4 GDT の精度で自身の記録も更新しました。 DeepMindチームは、タンパク質構造データベース(PDB)や、構造不明のタンパク質配列を含む大規模データベース(合計約17万個のタンパク質構造)など、公開されているデータを使用しました。実行は数週間続き、主に約128個のTPUv3コアを使用しました。 前述のように、タンパク質の3D構造を、残基を表すノードとそれらを密接に接続するエッジを持つ空間グラフとして考えると、この構造を理解するために、DeepMindチームは、注意ベースのニューラルネットワークシステムを作成し、エンドツーエンド方式でトレーニングし、構築された暗黙のグラフに基づいて推論を実行しました。 このプロセスを反復することで、システムはタンパク質の基礎となる物理構造を強力に予測し、数日以内に高精度な構造を決定することができます。さらに、 AlphaFoldは内部の信頼性指標を用いて、予測されたタンパク質構造のどの部分が最も信頼できるかを判断することができます。 AlphaFoldの責任者であるジョン・ジャンパー氏は、「真に生物学的に関連性があり、実験的に競争力のある」結果を生み出すまでには、まだ長い道のりがあると考えている。 CASP会長のジョン・モルト教授は、「DeepMindが先導役を果たしました。生物学における50年来の問題がほぼ解決されました。これは、医薬品設計やタンパク質設計といった新興分野に大きな影響を与えるでしょう」と述べました。 DeepMindチームは、新しいAlphaFoldシステムに関連する論文を適切な時期に査読付き学術誌に提出する予定であると述べた。 https://deepmind.com/blog/article/alphafold-a-solution-to-a-50-year-old-grand-challenge-in-biology
インターンシップ/正社員編集者・記者募集中 ぜひ当社にご参加いただき、プロフェッショナルなテクノロジーメディアでの執筆業務のあらゆる側面を直接体験してください。世界中から集まった優秀な人材と共に、将来有望な業界で成長を共に目指しましょう。場所は北京、清華大学東門近くです。Big Data Digestホームページのチャットページで「recruitment(採用)」とご返信いただければ、詳細をお知らせいたします。履歴書は[email protected]まで直接お送りください。
|