Skip to main content
QUICK REVIEW

[论文解读] ProAgent: From Robotic Process Automation to Agentic Process Automation

Yining Ye, Xin Cong|arXiv (Cornell University)|Nov 2, 2023
Robotic Process Automation Applications被引用 9
一句话总结

本文提出了 Agentic Process Automation(APA),并实现 ProAgent——一个基于大型语言模型(LLM)的代理系统,通过协调专业代理来构建和执行工作流,超越传统的RPA。

ABSTRACT

From ancient water wheels to robotic process automation (RPA), automation technology has evolved throughout history to liberate human beings from arduous tasks. Yet, RPA struggles with tasks needing human-like intelligence, especially in elaborate design of workflow construction and dynamic decision-making in workflow execution. As Large Language Models (LLMs) have emerged human-like intelligence, this paper introduces Agentic Process Automation (APA), a groundbreaking automation paradigm using LLM-based agents for advanced automation by offloading the human labor to agents associated with construction and execution. We then instantiate ProAgent, an LLM-based agent designed to craft workflows from human instructions and make intricate decisions by coordinating specialized agents. Empirical experiments are conducted to detail its construction and execution procedure of workflow, showcasing the feasibility of APA, unveiling the possibility of a new paradigm of automation driven by agents. Our code is public at https://github.com/OpenBMB/ProAgent.

研究动机与目标

  • 克服在处理需要人类般智能和动态决策的任务时对 RPA 的局限性的动机。
  • 提出 APA 作为一个范式,将智能劳动在工作流的构建和执行阶段下放给基于 LLM 的代理。
  • 实例化 ProAgent 以演示代理驱动的工作流构建和代理驱动的工作流执行。
  • 定义一个 Agentic Workflow Description Language,将数据流和控制流形式化,以便 LLM 理解。
  • 通过在商业场景中的概念验证实验展示可行性。

提出的方法

  • 使用 JSON 设计数据流的 Agentic Workflow Description Language,使用 Python 代码实现控制流。
  • 引入 DataAgent 和 ControlAgent,在执行过程中处理数据并进行动态决策。
  • 使用 GPT-4 进行工作流构建,包含四个迭代步骤:action_define、action_implement、workflow_implement、task_submit。
  • 通过一个 Python 解释器实现工作流执行,使 mainWorkflow 依次运行。
  • 在基于 n8n 的工作流平台上进行概念验证实验,演示在 Google Sheets–Slack/Email 场景中的构建与执行。

实验结果

研究问题

  • RQ1LLM 基于的代理是否能够在从人类指令中自主构建工作流并编排专业代理以进行动态决策?
  • RQ2ProAgent 是否能够在自动化工作流中处理复杂的数据处理和控制流决策?
  • RQ3在真实世界的工作流平台中,Agentic Process Automation 的可行性与实用性如何?
  • RQ4Agentic Workflow Description Language 如何使 LLM 生成一致、可执行的工作流?

主要发现

  • ProAgent 通过从人类输入生成工作流语言和基于 Python 的控制逻辑,展示了自主的工作流构建能力。
  • DataAgent 和 ControlAgent 使工作流中的动态数据处理和有条件分支成为可能,提升了灵活性。
  • 概念验证实验表明,在开放平台(n8n)上构建和执行代理驱动的工作流是可行的。
  • Agentic Workflow Description Language 提供了一种结构化、面向代码的格式(数据用 JSON,控制用 Python),适合 LLM 的预训练。
  • 该方法讨论了与工具学习、过程挖掘和安全性等方面的集成,强调了代理驱动自动化的潜在收益与风险。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。