基于零样本学习的机器教学构建模块化智能代理

Jan, 2024

基于零样本学习的机器教学构建模块化智能代理

Machine Teaching for Building Modular AI Agents based on Zero-shot Learners

Karan Taneja, Ashok Goel

TL;DR利用大型语言模型作为零射击学习器的模块化人工智能代理的鲁棒性和性能可以通过迭代式机器教学方法提升，该方法通过有限的人类反馈在时间上训练人工智能代理，从而解决零射击学习的质量限制，并利用初始部署的数据和零射击学习器的输出或注解来训练更小且任务特定的替代模型，从而降低经济成本和环境影响。在三个与对话式人工智能代理相关的任务上的结果表明，在任务的复杂性和零射击学习器的性能决定下，仅对数据集的 20-70% 进行监督就可以实现接近理想结果的性能。

Abstract

The recent advances in large language models (LLMs) have led to the creation of many modular ai agents. These agents employ LLMs as zero-shot lea

large language models modular ai agents zero-shot learners iterative machine teaching task-specific substitute models

发现论文，激发创造

构建工业级对话助手的零 - shot 槽填充系统的方法

我们提出了一种基于大型语言模型（LLM）的插槽填充系统，用于在跨多种工业级应用领域中的会话助手中执行对话状态跟踪。

Jun, 2024

零射语言代理用于带有结构反射的计算机控制

通过自反思和结构化思考管理，我们的零 - shot 代理在简单的 MiniWoB++ 任务中表现出更高效的推理能力，并且在复杂的任务中能够与之前的最佳模型相媲美，尽管之前的研究可以访问专家示例或额外的屏幕信息。

Oct, 2023

代理指导大型语言模型成为普适零样学习推理器

改善大型语言模型在通用语言理解任务上的零样本推理能力的方法，通过建立一个自动代理来指导大型语言模型的推理过程，将零样本推理能力进一步发挥到更多任务中，取得了在众多数据集上的最先进的零样本性能。

Oct, 2023

大型语言模型的零样本文本分类器

利用零样本学习采用递进性思维提示，与传统的问答格式相比，GPT 模型在文本分类问题上具备零样本分类器的能力，有效地利用提示策略在各种文本分类场景中展现出较好的性能。

Dec, 2023

关于零样本机器生成文本检测器稳定性的评估

通过我们的研究，我们发现了自然语言生成、零样本机器生成文本检测以及大型语言模型等关键词之间的显著相关性，同时我们还探讨了话题转变对零样本检测方法的影响，揭示了这些检测方法在各种不同话题下的适应性和鲁棒性。

Dec, 2023

作为零样本人类模型的大型语言模型用于人机交互

本文探索了使用大型语言模型作为 HRI 的 0 模型的潜力，并在三个社交数据集上进行了实验，结果显示 LLMs 能够实现与定制模型相当的性能，同时还讨论了当前的限制。基于我们的发现，我们展示了 LLM 人类模型如何集成到社交机器人的规划过程中并应用于 HRI 场景。我们的结果表明 LLMs 为 HRI 的人类建模提供了一种有前途但不完整的方法。

Mar, 2023

零样本分类中的提示复杂度导航：计算社会科学中大型语言模型的研究

在计算社会科学分类任务中，评估了 ChatGPT 和 OpenAssistant 两种公共可访问的 LLM 的零次效果，并研究了各种提示策略的影响。发现在零次设置下，当前 LLMs 无法与较小的经过微调的基线变压器模型（如 BERT）的性能匹配。此外，发现不同的提示策略可以显着影响分类准确性，准确性和 F1 分数的差异超过 10％。

May, 2023

使用统一的多选视角进行零样本自然语言理解

本篇论文提出一种新的零样本学习范式，其适用于任何格式，并适用于一系列语言任务，如文本分类、常识推理、指代消解和情感分析，并将零样本学习转化为多选任务，从而避免大规模生成模型的问题。该方法不仅增加了模型的推广能力，而且显著减少了参数的数量，同时具有高效的训练和部署特点。经实验结果表明，该方法在多个基准测试中表现卓越，且仅使用了 235M 的参数，远小于拥有十亿参数的现有先进模型。

Oct, 2022

基于大型语言模型的零射击提示在开放域人机对话中的角色扮演

采用角色扮演零样本提示作为一种高效且经济有效的方法，本研究使用能遵守指令的多语言 LLM（Beeching 等，2023 年）进行开放领域对话，并设计了一个提示系统，与 Vicuna（Chiang 等，2023 年）模型相结合，产生与精调模型在两个不同任务的人类评估中相匹配甚至超越的对话代理。

Jun, 2024

大型语言模型是零样本推理器

该研究发现预训练的大型语言模型可以成为良好的零样本推理器，提出了一种零样本的 CoT 方法，将其用于多种复杂的推理任务并取得了显著的性能提升。

May, 2022