Skip to main content
QUICK REVIEW

[論文レビュー] dZiner: Rational Inverse Design of Materials with AI Agents

Mehrad Ansari, Jeffrey Watchorn|arXiv (Cornell University)|Oct 4, 2024
Modular Robots and Swarm Intelligence被引用数 7
ひとこと要約

dZiner は、領域指向の設計ルールを用いた LLM-powered AI agents を用いて、サーファクタント、薬物リガンド、MOF リンカーにわたる材料の合理的逆設計を実行し、代理モデルによる高速特性推定を可能にする閉ループおよび人間を介在させたワークフローを実現する。

ABSTRACT

Recent breakthroughs in machine learning and artificial intelligence, fueled by scientific data, are revolutionizing the discovery of new materials. Despite the wealth of existing scientific literature, the availability of both structured experimental data and chemical domain knowledge that can be easily integrated into data-driven workflows is limited. The motivation to integrate this information, as well as additional context from first-principle calculations and physics-informed deep learning surrogate models, is to enable efficient exploration of the relevant chemical space and to predict structure-property relationships of new materials a priori. Ultimately, such a framework could replicate the expertise of human subject-matter experts. In this work, we present dZiner, a chemist AI agent, powered by large language models (LLMs), that discovers new compounds with desired properties via inverse design (property-to-structure). In specific, the agent leverages domain-specific insights from foundational scientific literature to propose new materials with enhanced chemical properties, iteratively evaluating them using relevant surrogate models in a rational design process, while accounting for design constraints. The model supports both closed-loop and human-in-the-loop feedback cycles, enabling human-AI collaboration in molecular design with real-time property inference, and uncertainty and chemical feasibility assessment. We demonstrate the flexibility of this agent by applying it to various materials target properties, including surfactants, ligand and drug candidates, and metal-organic frameworks. Our approach holds promise to both accelerate the discovery of new materials and enable the targeted design of materials with desired functionalities. The methodology is available as an open-source software on https://github.com/mehradans92/dZiner.

研究の動機と目的

  • AI エージェント・フレームワーク内で人間の専門知識と文献由来の知識を活用する新しい材料設計パラダイムを提案する。
  • LLM-powered agents を用いた複数の材料クラスに対する inverse design(性質から構造へ)を可能にする。
  • 候補分子を迅速に評価するための化学情報に基づく設計指針と代理モデルを組み込む。
  • 不確実性と実現性の評価を備えた閉ループおよび人間インザループのワークフローをサポートする。

提案手法

  • ReAct 風の推論と行動ループに従う大規模言語モデル(LLMs)によって動作するエージェントベースの設計フレームワーク。
  • 候補生成を導く学術文献から取得したドメイン固有の設計指針を組み込む。
  • 評価前に化学的妥当性を確認し、合成可能性を評価するために SMILES 文字列を検証する。
  • 生成された候補をドメイン専門の代理モデル(および適用可能な場合はドッキング)で評価し、ターゲット特性を不確実性とともに推定する。
  • 人間の化学者のフィードバックを人間-in-the-loop 設定で反復を誘導できるようにする。
  • 三つの逆設計タスク(サーファクタント:CMC、WDR5 リガンド:ドッキング、MOF 有機リンカー:CO2 吸着)に適用可能性を示す。
Figure 1: dZiner workflow overview . The model starts by inputting the material’s initial structure as a textual representation. The AI agent dynamically retrieves domain-knowledge (design guidelines) for Property X from scientific literature, the Internet or other resources. Based on these guidelin
Figure 1: dZiner workflow overview . The model starts by inputting the material’s initial structure as a textual representation. The AI agent dynamically retrieves domain-knowledge (design guidelines) for Property X from scientific literature, the Internet or other resources. Based on these guidelin

実験結果

リサーチクエスチョン

  • RQ1文献由来の設計指針と代理モデルを強化された LLM ベースのエージェントが、さまざまな材料クラスにわたる合理的逆設計を実行できるか。
  • RQ2ドメイン知識と人間-in-the-loop のフィードバックの包含が、妥当性、実現性、ターゲット特性の最適化にどう影響するか。
  • RQ3このフレームワーク内で、化学設計タスクにおける Claude 3.5 Sonnet と GPT-4o の比較上の利点は何か。
  • RQ4実現性と分子量制約を尊重しつつ、性質の改善をどの程度フレームワークが達成し得るか。

主な発見

  • dZiner は三つのタスクでターゲット特性の大幅な改善を達成し、ドメイン知識を活用した実行がベースラインを上回る。
  • サーファクタントでは、-domain knowledge を用いた場合に化学的妥当性が高いままCMCの改善が約2桁のオーダーで達成される。
  • WDR5 リガンド設計では、ドッキングスコアが有意に改善し(ケースによっては -9.3 まで)、分子量600 g/mol 以下の妥当・合成可能な類似体が多数得られる。
  • MOF リンカー設計では、CO2 吸着容量が substantial に向上(最大 2.289、最終承認リンカー 1.978)し、分子量は低いまま維持される。
  • 人間インザループの指導により、より多様で標的化された修正が可能となり、閉ループのみよりもドッキングおよび SAR に関連する結果を向上させ得る。
  • タスクを通じて、Claude 3.5 Sonnet は一般に GPT-4o よりも、文献由来の指針を用いた場合に有効な分子生成とターゲット特性改善を達成する傾向がある。
Figure 2: dZiner’s chain-of-thoughts in the closed-loop inverse design of surfactants with lower CMC . The agent is powered by Claude 3.5 Sonnet. The design guidelines are retrieved from references [ 39 , 40 , 41 , 42 , 43 , 44 , 45 , 46 ] , and the model is asked to keep the molecular weight lower
Figure 2: dZiner’s chain-of-thoughts in the closed-loop inverse design of surfactants with lower CMC . The agent is powered by Claude 3.5 Sonnet. The design guidelines are retrieved from references [ 39 , 40 , 41 , 42 , 43 , 44 , 45 , 46 ] , and the model is asked to keep the molecular weight lower

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。