The Ohio State University, Tsinghua University, Cisco Research Agent

背景
论文指出，大型语言模型（LLMs）在真实世界环境中的应用远远超出了文本处理的局限，但这些环境的复杂性往往超越了LLMs的短期记忆能力。现有研究已经尝试用工具来扩展LLMs的能力，尤其是在处理复杂环境时，如知识库（KBs）和数据库。
已有的工作 现有工作尝试将环境线性化成LLMs能够处理的标记序列，但由于输入大小的限制和环境的复杂性，这种方法在扩展到更复杂的环境时面临挑战。其他方法尝试生成未连接到环境的初步计划，然后再在后处理中进行连接，或者使用预定义规则来评估已连接的计划，但这些策略没有充分利用LLMs在主动导航复杂环境时的推理潜力。

提出了一个新的框架 FUXI
- 挑战1：如何使LLMs能够有效处理复杂环境 论文提出使用自定义的工具作为中间件层，通过串联特定的扩展工具和推理算法来允许LLMs高效利用这些工具进行主动探索和准确响应环境中的任务。
- 挑战2：如何设计适应不同复杂环境的工具 研究人员开发了针对数据库和知识库环境的定制工具，并采用人类信息搜集行为的直觉来满足这些环境中复杂任务的需求，并与LLMs的推理能力相结合，从而突破了当前技术的局限性。

文章评估了在数据库和知识库环境中，使用FUXI框架增强的LLMs性能。特别是在使用GPT-4且通过定制工具的支持时，性能相较于最佳基线分别提高了2.8倍和2.2倍。这些结果表明，通过使用工具增强LLMs，显著提升了其在复杂环境中处理任务的能力。

通过为LLMs设计特定的工具和推理算法，研究开发了名为FUXI的新框架，有效提高了LLMs在复杂环境中的操作能

Provide feedback

Saved searches