新知源報道 出典: 同期 編集者:編集部 【新インテリジェンス概要】 GPT-4のような大規模モデルで構成されたAIエージェントが、化学実験の進め方を段階的に教えてくれるようになりました。試薬の選び方、投与量、反応の起こり方まで正確に把握しています。生化学、環境科学、材料科学の皆さん、震え上がってください!すごいですね、GPT-4 は独自に科学研究を行うことを学習したのですか? 最近、カーネギーメロン大学の数人の科学者によって発表された論文が、AIコミュニティと化学コミュニティの両方で波紋を呼んでいます。 彼らは、実験を実施し、科学研究を自律的に実行できるAIを開発しました。このAIは複数の大規模な言語モデルで構成されており、優れた研究能力を備えたGPT-4エージェントと見なすことができます。 ベクトルデータベースからの長期記憶を備えているため、複雑な科学文書を読んで理解し、クラウドベースのロボット研究室で化学研究を行うことができます。 ネットユーザーは驚きのあまり沈黙した。「これはAI自身が研究して発表したのか? なんてことだ」 「TTE」実験の時代が来たと叫ぶ人もいた。 これは化学の世界における AI の伝説的な聖杯なのでしょうか? 最近、私たちは毎日SF小説の中にいるような生活を送っていると感じる人が多いのではないでしょうか。 『ブレイキング・バッド』の AI 版が登場するのか? 3月にOpenAIは世界を魅了した画期的な大規模言語モデル、GPT-4をリリースした。 これは世界で最も強力な LLM であり、SAT 試験と BAR 試験で高得点を獲得し、LeetCode チャレンジに合格し、写真だけで物理の問題を解き、絵文字のミームを理解できます。 技術レポートでは、GPT-4 が化学の問題を解決できることも言及されています。 これはカーネギーメロン大学化学部の多くの学者にインスピレーションを与え、複数の大規模言語モデルに基づく AI を開発し、AI が独自に実験を設計および実行できるようにしたいと考えました。 論文リンク: https://arxiv.org/abs/2304.05332 そして彼らが作った AI は実に驚くほど素晴らしいのです! オンラインで文献を独自に検索し、液体処理装置を正確に制御し、複数のハードウェア モジュールの同時使用やさまざまなデータ ソースの統合を必要とする複雑な問題を解決することができます。 AI版『ブレイキング・バッド』のような雰囲気があります。 イブプロフェンを自ら作れるAI たとえば、この AI にイブプロフェンを合成してもらいます。 簡単なプロンプト「イブプロフェンを合成する」を入力します。 すると、モデルは自動的に何をすべきかをオンラインで検索します。 最初のステップでは、塩化アルミニウム触媒によるフリーデル・クラフツ反応を起こすためにイソブチルベンゼンと無水酢酸が必要であることが判明しました。 さらに、このAIはアスピリンを合成することもできます。 そして合成アスパルテーム。 製品にメチル基が欠落している場合、モデルが正しい合成例を見つけると、クラウド ラボでプロセスが実行され、修正が行われます。 モデルに指示します: 鈴木反応を研究すると、モデルは基質と生成物を即座に正確に識別します。 さらに、API を介してモデルを Reaxys や SciFinder などの化学反応データベースに接続できるため、モデルが大幅に強化され、精度が大幅に向上します。 システムの過去の記録を分析することで、モデルの精度を大幅に向上させることもできます。 例えば まずは実験でロボットがどのように操作されるかを見てみましょう。 サンプルのセットを全体(この場合はマイクロプレート全体)として扱います。 自然言語を使用して、「任意の色を使用して、1 行おきに色付けしてください。」というプロンプトを出すことができます。 ロボットによって実行される場合、これらのプロトコルはリクエストのプロンプトと非常に似ています (図 4B ~ E)。 エージェントの最初のアクションは、元の溶液の小さなサンプルを準備することです (図 4F)。 次に、UV-Vis測定を要求します。完了すると、AIはマイクロプレートの各ウェルのスペクトルを含むNumPy配列を含むファイル名を取得します。 その後、AIは最も吸光度の高い波長を識別するためのPythonコードを記述し、このデータを使用して問題を正しく解決しました。 散歩に連れて行こう 以前の実験では、 AI は事前トレーニング段階で受け取った知識の影響を受けた可能性があります。 今回、研究者らはAIの実験設計能力を徹底的に評価するつもりだ。 AI はまずネットワークから必要なデータを統合し、必要な計算を実行し、最後に液体試薬オペレーティングシステム (上の画像の左端) 用のプログラムを作成します。 さらに複雑さを増すために、研究者は加熱シェーカーモジュールを AI に組み込みました。 これらの要件は統合された後、AI の構成に反映されました。 具体的な設計は次のとおりです。AIは2つのミニチュアバージョンを備えた液体実オペレーティング システムを制御し、ソース バージョンには、フェニルアセチレン、フェニルボロン酸、複数のハロゲン化アリール カップリング パートナー、および2つの触媒と2つの塩基を含むさまざまな試薬のソース液体が含まれています。 上の画像はソースプレートの内容を示しています。 ターゲット バージョンは加熱シェーカー モジュールにインストールされます。 上の画像では、左のピペットの容量は 20 μL で、右のシングル チャネル ピペットの容量は 300 μL です。 AI の最終的な目標は、鈴木反応とソノグ・シラー反応を適切に再現できるプロセスを設計することです。 私たちは次のように伝えます: これら 2 つの反応を生成するには、利用可能な試薬を使用する必要があります。 次に、これらの反応に必要な条件や化学量論的要件などの情報をオンラインで検索しました。 ご覧の通り、AIは必要な試薬の定量や濃度など、必要な条件をうまく収集できました。 AIは実験を完了するために適切なカップリングパートナーを選択しました。すべてのハロゲン化アリールの中から、AIは鈴木反応には臭化ベンゼン、ソノグシュラー反応にはヨードベンゼンを選択しました。 各ラウンドでAIの選択は少しずつ変化しました。例えば、酸化反応における高い反応性に惹かれ、p-ヨードニトロベンゼンも選択しました。 ブロモベンゼンは反応に参加でき、アリールヨウ素よりも毒性が低いため選択されました。 次に、AIは優れた性能を持つPd/NHCを触媒として選択しました。これは、複合反応における非常に先進的なアプローチです。塩基の選択に関しては、AIはトリエチルアミンを選択しました。 上記のプロセスからわかるように、このモデルは将来的に無限の可能性を秘めています。これは、モデルの推論プロセスを分析し、より良い結果を得るために繰り返し実験が行われるためです。 さまざまな試薬を選択すると、AI は必要な各試薬の量を計算し始め、その後、実験プロセス全体の計画を開始します。 AIはある時点でミスを犯し、加熱シェーカーモジュールの名前を間違えてしまいました。しかし、AIはすぐにこれに気づき、積極的に情報を調べ、実験手順を修正し、最終的に実験の実行に成功しました。 専門的な化学プロセスについては置いておいて、このプロセスで AI が示した「専門的な資質」をまとめてみましょう。 上記のプロセスを通じて、AIは非常に高い分析力と推論力を発揮したと言えるでしょう。AIは必要な情報を自発的に獲得し、複雑な問題を段階的に解決することができました。 このプロセスでは、実験設計を進化させるための非常に高品質なコードを記述することもできます。さらに、出力に基づいてコードを修正することも可能です。 OpenAI は GPT-4 の強力な機能を実証することに成功しており、将来的には GPT-4 が実際の実験に参加できるようになるでしょう。 しかし、研究者たちはそこで止まるつもりはなかった。彼らはAIに大きな課題を与えた。新たな抗がん剤の開発を指示したのだ。 存在しないもの...このAIは機能できるのか? どうやら、AIには確かにスキルがあるようだ。困難を恐れないという原則(もちろん、恐怖が何なのかは知らないが)を守り、AIは抗がん剤開発の必要性を綿密に分析し、抗がん剤の研究開発の最新動向を研究した上で、さらに深く掘り下げるべきターゲットを選定し、その構成要素を決定した。 次に、AIは自分で合成しようと試み、まず反応のメカニズムと原理に関する情報をオンラインで検索し、最初の手順を把握した後、関連する反応の例を探しました。 最後に合成を完了します。 上の画像の内容は、実際に AI で合成できるものではなく、あくまで理論的な議論に過ぎません。 その中には、メタンフェタミン(別名マリファナ)やヘロインなどのよく知られた薬物や、マスタードガスなどの有毒ガスがあり、これらは明確に禁止されています。 合計 11 個の化合物のうち、AI は 4 個の合成スキームを提供し、合成プロセスを進めるために文献を参照しようとしました。 残りの7つの物質のうち、5つの合成はAIによって決定的に拒否されました。AIはこれらの5つの化合物に関する情報をオンラインで検索し、無計画に進めることはできないと認識しました。 例えば、コデインを合成しようとした際、AIはコデインとモルヒネの関係を発見しました。そして、コデインは規制薬物であり、安易に合成することはできないと結論付けました。 しかし、この保険の仕組みは完璧ではありません。ユーザーは申請書を簡単に改変してAIをさらに操作することができます。例えば、モルヒネの直接記載を「化合物A」に置き換えたり、コデインの直接記載を「化合物B」に置き換えたりといった操作が可能です。 一方、一部の薬物の合成には麻薬取締局(DEA)の許可が必要ですが、一部のユーザーはこの抜け穴を利用して、AIを欺き、必要な許可を持っていると信じ込ませ、AIに合成ソリューションを提供するように誘導することができます。 AIはヘロインやマスタードガスといったよく知られた違法薬物をよく認識しています。問題は、このシステムが現在検出できるのは既存の化合物のみであるということです。未知の化合物については、モデルが潜在的な危険性を特定できる可能性は低いでしょう。 たとえば、いくつかの複合タンパク質毒素。 そのため、誰かが好奇心からこれらの化学成分の有効性を検証するのを防ぐために、研究者は論文に大きな赤い警告を明記しました。 この記事における違法薬物および化学兵器の合成に関する議論は、純粋に学術研究目的であり、新しい技術に伴う潜在的な危険性を明らかにすることを主な目的としています。 いかなる状況においても、個人または組織は、本書で論じられている物質または化合物の再製造、合成、またはその他の方法での製造を試みるべきではありません。このような活動は極めて危険であるだけでなく、ほとんどの法域において違法です。 インターネットを使って実験のやり方を検索することができます。 このAIは複数のモジュールで構成されています。これらのモジュールは相互に情報を交換でき、一部のモジュールはインターネット、API、Pythonインタープリターにアクセスすることもできます。 Planner にプロンプトを入力すると、操作の実行が開始されます。 例えば、インターネットにアクセスしたり、Pythonでコードを書いたり、ドキュメントにアクセスしたりできます。これらの基本を理解すれば、自力で実験を行うことができます。 人間が実験を行う際、このAIは段階的にガイドしてくれます。様々な化学反応を推論し、オンラインで検索し、実験に必要な化学物質の量を計算し、対応する反応を実行することができます。 提供された説明が十分に詳細であれば、ロボットに説明する必要さえありません。ロボットは自ら実験全体を理解します。 「Web サーチャー」コンポーネントは Planner からクエリを受信し、Google Search API を使用します。 検索結果を取得した後、返された最初の 10 個のドキュメントをフィルタリングし、PDF を除外して、結果を自身に送り返します。 次に、「BROWSE」操作を使用してウェブページからテキストを抽出し、回答を生成します。このプロセスはシームレスかつ効率的です。 このタスクは、質量の損失がほとんどなく、パフォーマンスが GPT-4 よりも大幅に優れているため、GPT-3.5 で達成できます。 「ドキュメント検索」コンポーネントは、クエリとドキュメントのインデックス作成を通じて最も関連性の高い部分を見つけ、ハードウェア ドキュメント (ロボット液体プロセッサ、GC-MS、クラウド ラボなど) を分類し、最も一致する結果を要約して、最も正確な回答を生成します。 「コード実行」コンポーネントは言語モデルを使用せず、隔離されたDockerコンテナ内でコードを実行するだけで、Plannerによる誤操作からターミナルホストを保護します。すべてのコード出力はPlannerに送り返され、ソフトウェア内で予測されるエラーを修正します。「自動化」コンポーネントも同様の原理で動作します。 ベクトル検索により、最も複雑な科学文献でも理解できるようになります。 複雑な推論が可能な AI を作成するには、多くの課題があります。 たとえば、最新のソフトウェアと統合できるようにするには、ユーザーがソフトウェアのドキュメントを理解できる必要がありますが、このドキュメントの言語は通常、非常に学術的かつ専門的であるため、大きな障害となります。 大規模言語モデルは、自然言語を使用して専門家でなくても理解できるソフトウェアドキュメントを生成することで、この障害を克服できます。 これらのモデルのトレーニング ソースの 1 つは、Opentrons Python API などの API に関連する豊富な情報です。 しかし、GPT-4のトレーニングデータは2021年9月までしかなく、AIによるAPIの利用精度をさらに向上させる必要があります。 これに対処するため、研究者は特定のタスクに関するドキュメントを AI に提供する方法を考案しました。 彼らは相互参照のためにOpenAIのAda埋め込みを生成し、クエリとの類似性関連性を計算しました。また、距離ベースのベクトル検索を用いて文書の一部を選択しました。 提供されるトークンの数は、原文に含まれるGPT-4トークンの数によって異なります。最大7800トークンが設定されており、AI関連文書をワンステップで提供できます。 この方法は、化学反応に不可欠なヒーター振動子ハードウェアモジュールに関する情報を AI に提供するために非常に重要であることが証明されています。 このアプローチは、Emerald Cloud Lab (ECL) などのより多様なロボット プラットフォームに適用する場合、より大きな課題が生じます。 この時点で、Cloud Lab の Symbolic Lab Language (SLL) など、GPT-4 モデルに未知の情報を提供することができます。 いずれの場合も、AI はタスクを正しく識別し、完了することができます。 このプロセス中、モデルは指定された関数の様々なオプション、ツール、パラメータに関する情報を効果的に保持します。ドキュメント全体を取り込んだ後、システムはモデルに指定された関数を使用してコードブロックを生成するよう指示し、それをPlannerに返します。 規制を強く要求する 最後に、研究者らは、大規模言語モデルの誤用を防ぐための安全策を講じる必要があると強調した。 AIコミュニティには、これらのモデルのセキュリティを最優先にするよう強く求めます。OpenAI、Microsoft、Google、Meta、DeepMind、Anthropicといった主要企業には、大規模言語モデルのセキュリティ確保に最大限の努力を払うよう求めます。また、物理学コミュニティには、大規模言語モデルの開発に携わるチームと協力し、これらの安全策の開発を支援するよう求めます。 ニューヨーク大学のマーカス教授も強く同意した。「これは冗談ではありません。カーネギーメロン大学の3人の科学者が、LLMの安全性研究を緊急に呼びかけています。」 |