-
背景
论文提出了在将大型语言模型(LLM)集成到当前开发者工作流程中时,必须限制它们的输出以遵循特定格式或标准的问题。这种做法对于开发者而言尤其重要,因为它将有助于降低他们进行开发、测试和整合LLM提示的重复性高且耗时的工作量,并且有利于提升使用LLM特性和应用程序的用户体验。 -
已有的工作 已有的工作比如指令微调技术已经大幅提高了在用户请求时生成有效JSON对象的可能性,但调查响应者认为这还不够,他们期望能够更精确地控制输出。
- 提出了一个xxx
- 挑战1:输出约束 调查发现,产业界专业人士对输出约束的需要呈现出多样性,这些约束分为低级别的和高级别的。低级别约束确保模型输出遵循特定的结构,如JSON或Markdown,执行纯选择任务(例如情感分类)或规定输出的长度。高级别约束要求模型输出遵循语义(例如,必须包含或避免特定术语或行动)或风格(例如,遵循某种风格或语气)指导,同时防止虚构。论文通过对调查用例的分析,提出了实现这些约束的方法和构想。
响应者认为,能够应用约束到LLM输出将具有开发者面向和用户面向的双重好处。对于开发者,它能提升基于提示的开发效率、加快提示设计与工程化流程(减少试错)、减少或消除特定解析和连接逻辑、节约请求多个候选方案的成本。对于用户,它有助于满足产品和UI要求、确保输出长度和格式的一致性、能更好的融入下游流程和工作流、提升用户体验和信任以及增加客户满意度和采纳。
本论文探索如何为大型语言模型(LLM)输出实现用户中心的约束,通过调查行业专业人士来了解不同场景和需求。重点是提高开发者在开发、测试和整合LLM过程中的效率,并通过满足特定的输出格式和用户界面要求来增强最终用户的体验。