GoEX: Perspectives and...

  • AMiner学术头条
  • 2024-09-07 20:43:06
GoEX: Perspectives and Designs Towards a Runtime for Autonomous LLM Applications网页链接
本文探讨了如何让人类有效地与自主大型语言模型(LLM)协作、委派任务和监督其行动。当前,人类在将LLM生成的输出(如代码、函数或行动)投入现实世界执行前,需要验证其正确性和适当性,这一过程极具挑战性,因为代码理解难度众所周知。文章认为,“事后验证”——在看到输出后验证提议行动的正确性——通常比“事前验证”要容易得多。实现事后验证系统的核心概念是集成一个直观的撤销功能,并为LLM生成的行动建立一个损害限制机制,以有效减轻相关风险。借助这一机制,人类现在可以撤销LLM生成的输出效果,或者确信潜在风险是有限的。文章认为这是关键,可以解锁LLM代理在与应用程序和服务互动时有限(事后)人类参与的潜力。文章描述了我们的开源LLM行动执行运行时——大猩猩执行引擎(GoEX)的设计和实现,并提出了实现LLM与应用互动并最小化人类监督目标的开研究问题。我们将在网页链接发布GoEX。
人工智能论文写作大模型
GoEX: Perspectives and...