[论文解读] Agents for self-driving laboratories applied to quantum computing
该论文提出 k-agents,一种基于知识的多代理框架,使用基于LLM的代理来自动化实验室实验,通过标定和操作超导量子处理器并在闭环反馈下产生纠缠态进行演示。
Fully automated self-driving laboratories are promising to enable high-throughput and large-scale scientific discovery by reducing repetitive labour. However, effective automation requires deep integration of laboratory knowledge, which is often unstructured, multimodal, and difficult to incorporate into current AI systems. This paper introduces the k-agents framework, designed to support experimentalists in organizing laboratory knowledge and automating experiments with agents. Our framework employs large language model-based agents to encapsulate laboratory knowledge including available laboratory operations and methods for analyzing experiment results. To automate experiments, we introduce execution agents that break multi-step experimental procedures into agent-based state machines, interact with other agents to execute each step and analyze the experiment results. The analyzed results are then utilized to drive state transitions, enabling closed-loop feedback control. To demonstrate its capabilities, we applied the agents to calibrate and operate a superconducting quantum processor, where they autonomously planned and executed experiments for hours, successfully producing and characterizing entangled quantum states at the level achieved by human scientists. Our knowledge-based agent system opens up new possibilities for managing laboratory knowledge and accelerating scientific discovery.
研究动机与目标
- 动机并应对具有多模态和动态知识的实验室自动化挑战。
- 提出 k-agents 框架,在不进行微调的情况下将实验室知识编码到基于代理的系统中。
- 展示使用代理驱动的工作流对超导量子处理器进行自治标定和运行。
- 展示知识、翻译、检查与执行代理如何实现闭环的实验计划与执行。
提出的方法
- 定义知识代理,通过自然语言传递实验室知识。
- 实现代码翻译代理和程序翻译代理,将自然语言指令转换为可执行代码。
- 引入检查代理,分析实验结果并生成自然语言报告。
- 开发一个执行代理,将程序分解为基于代理的状态机,并协调多步实验。
- 将翻译准确性与标准 RAG 方法进行基准对比,并用示例图评估视觉检查的有效性。
- 将该框架应用于在 16-qubit 超导处理器上自动化单-qubit 和双-qubit门的标定,并利用层析生成 GHZ 态。
实验结果
研究问题
- RQ1在不进行广泛微调的情况下,基于知识的多代理系统如何实现对长时间、多模态实验室工作流的自动化?
- RQ2基于LLM的代理是否能有效将自然语言实验指令翻译为可执行的实验室操作?
- RQ3闭环的基于代理的状态机是否能够实现对超导量子处理器的可扩展自治标定与运行?
- RQ4基于代理的检查(尤其是带有视觉示例的检查)对决策实验成功的影响有多大?
- RQ5这样的框架在产生纠缠态并量化保真度方面能达到与人类专家相当的程度到何种程度?
主要发现
- 在测试的模型中,GPT-4o 取得了最高的翻译准确性,达到 97%。
- 该系统实现了对单量子比特参数的全自动重新标定,以及在 16-qubit 处理器上自动发现两量子比特 SIzzle 门参数。
- 使用示例图的检查代理在视觉检查任务中对确定实验成功的表现最好。
- 工作流运行长达 3 小时,探索最多 100 个实验并测试最多 20 个驱动频率以确定最优 SIzzle 门参数。
- 人工指示的 GHZ 态层析得到密度矩阵的保真度为 83.83%。
- 在经验证的单量子比特上进行的随机基准测试实现了门保真度 99.869% ± 0.013%。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。