CONSCENDI：一种对比和场景引导的蒸馏方法，用于虚拟助手的护栏模型

Apr, 2023

CONSCENDI: A Contrastive and Scenario-Guided Distillation Approach to Guardrail Models for Virtual Assistants

Albert Yu Sun, Varun Nair, Elliot Schumacher, Anitha Kannan

TL;DR本文研究使用 GPT-4 的训练数据和蒸馏方法，探索了一种称为 CONSCENDI 的守护模型，用于监控虚拟助手的输出，以保持其输出符合设计规则，提供了一种新方法以生成更多样化的违规训练数据。研究表明，使用 CONSCENDI 得到的守护模型比基础模型表现更好。

Abstract

A wave of new task-based virtual assistants has been fueled by increasingly powerful large language models, such as gpt-4. These conversational a

发现论文，激发创造

本篇论文提出了使用自然语言指定限制条件的语言模型的文本生成任务，并创建了挑战性的基准 Cognac。我们提出了一种名为 CognacGen 的方法，旨在利用语言模型的内部知识来引导生成，它可以成功地推广到未看到的指令，并在生成符合限制的文本方面优于竞争基线。

Dec, 2022

CONA 是一个灵活的框架，旨在利用大型语言模型的能力以及结合 DIKW 层次结构自动指导和优化演示内容，提供适应受众群体的上下文感知答案，是知识传播和交流领域中的一项创新工作，可以为日常知识共享场景提供有效支持。

May, 2023

本研究提出了一种基于神经网络的对话代理方法，通过数据精简和模型训练相结合的方式，使得该代理能够根据输入上下文自动调整回复的具体程度，同时使用增强学习系统从多个生成模型中选择最适合当前输入的模型，从而生成更有趣、更高质量的回复。

Feb, 2017

本研究探讨了数据人工制品对机器学习模型泛化能力所产生的影响，提出一种基于对比学习的框架，试图鼓励深度学习模型学习普适规律并忽略数据人工制品。研究表明该方法具有很好的实验效果。

May, 2022

本文介绍 DialGuide—— 一种使用自然语言规则控制对话模型行为的新框架，并证明其在安全对话领域是有效的，可以产生遵循开发人员准则的安全和有趣回应。

Dec, 2022

由于迁移趋势，有效的第二语言习得至关重要。本文提出了一种通过人本互动语言实践的 AI 对话系统来解决这个问题的方案，并提供了一种自动化框架来选择机器学习模型，以质量保证专有的生成对话模型。

Mar, 2022

本文介绍了一种名为 AutoConcierge 的系统，该系统利用 LLMs 和 ASP 来开发一种可以真正 “理解” 人的对话的对话代理，从而在特定领域向用户提供有关当地餐厅的建议，是第一个能够像人一样进行真正对话并根据真正理解的人类话语提供帮助的自动对话代理。

Mar, 2023

本文介绍了我们在 DSTC-10 上构建对话模型的方法。为缩小口头和书面数据之间的差距，我们采用了大量数据扩增策略，包括人工误差注入和文本转语音转换。我们改良了预训练语言模型，并对每个子任务应用了集成算法，以训练稳健的口头对话模型。我们的方法在官方评估中排名第三，在最终的正式人类评估中排名第二。

Mar, 2022

研究知识基础对话系统，控制生成神经对话模型，加入不同的评估措施作为样式控制以鼓励模型生成有据可依的响应，并通过人类评估研究判断控制生成模型的产出通常更加客观和有据可依。

Jul, 2021

研究提出了 SELF-ALIGN 方法，利用少量人工监督和结合原理驱动推理和 LLM 的生成能力，实现 AI 助手的自我对齐，减少人工监督的依赖，获得更好的性能，开发了 Dromedary AI 助手。

May, 2023