在开放式文本世界中进行少样本任务迁移的专家混合方法

May, 2024

在开放式文本世界中进行少样本任务迁移的专家混合方法

A Mixture-of-Experts Approach to Few-Shot Task Transfer in Open-Ended Text Worlds

Christopher Z. Cui, Xiangyu Peng, Mark O. Riedl

TL;DR多任务学习中混合专家模型与注意力机制结合的研究表明，代理能够在开放式环境中通过重用先前任务的知识并快速学习新任务，同时在零样本和少样本学习中表现出更高的奖励获得和采样效率。

Abstract

open-ended worlds are those in which there are no pre-specified goals or environmental reward signal. As a consequence, an agent must know how to perform a multitude of tasks. However, when a new task is presente

open-ended worlds agent mixture-of-experts model attention mechanism few-shot learning

发现论文，激发创造

使用任务级别 Mixture-of-Experts 挖掘和理解跨任务技能

本文介绍了一种针对 NLP 任务的基于任务级别的专家混合模型，该模型使用一组具有灵活性的 Transformer 层和一个路由组件进行任务分配，其表现优于传统的多任务学习模型，同时也发现保留人类任务分类方法对提高模型性能有一定帮助。

May, 2022

开放式学习导致通用能力的代理

本文介绍了一种基于多智能体、开放式学习的方法，其能够使得智能体在一种包含大量挑战、跨越多个任务、更广泛的行为通用化领域中表现出非凡的学习能力。通过在环境中建立一个任务的宇宙，我们的训练代理能够跨越更广泛的任务领域，这个领域自然多智能体，涉及合作竞争等多种类型的游戏，而这一领域的挑战对于智能体来说多种多样，因此，我们提出了一种迭代方法来改进代理的效果，而不是试图最大化一个单一目标。最终，我们证明了这种代理的通用能力，可以通过简单的微调实现更大规模的行为传递。

Jul, 2021

学习基于知识图谱的文本环境世界模型

该论文聚焦于构建基于文本的游戏环境的世界模型，利用知识图谱和自然语言行动生成模型，提升增强学习智能体在该环境下的效率。通过零样本消融实验，表明该方法显著优于现有的文本世界建模技术及其各自贡献的重要性。

Jun, 2021

少即是多：多模态少样本学习的深入研究

为了解决深度学习中少样本学习的挑战，我们提出了一个简单而有效的框架，专门设计用于利用文本信息和语言模型，通过学习可调的提示来显式地利用预训练的语言模型的零样本能力，并且直接将视觉特征和文本特征进行推断而无需复杂设计的融合模块，进一步运用自集成和蒸馏来增强这些组件，在四个广泛使用的少样本数据集上进行了大量实验证明我们的简单框架取得了令人印象深刻的结果，特别值得注意的是，在 1-shot 学习任务中，我们的分类准确率平均超过基准方法 3.0%。

Jan, 2024

机器阅读理解的模块化方法：任务感知专家混合

该论文介绍了一个针对较小数据集的任务感知专家网络混合模型，重点研究常识学习问题，并通过训练不同的专家网络来捕获每个段落、问题和选项三元组之间不同类型的关系，同时灵感来自多任务和迁移学习的最新进展。通过将多个网络融合，强制实现它们的特定目标和关系，作者达到了最先进的结果并减少了过拟合。

Oct, 2022

学习组合主题感知专家混合模型用于零样本视频字幕生成

该论文提出了一种基于 TAMoE 模型的零样本视频字幕生成方法，利用外部相关语料库构建出各个活动的主题嵌入向量，从而实现对新活动的描述，具有很强的推广能力。

Nov, 2018

整合多样知识源进行在线一次性学习新任务

研究使用多种知识源在 Soar 认知结构下开发智能体，探讨不同知识源对一次性学习新任务的作用。测试结果表明，混合不同知识源可以提高智能体的学习效率，减少人类反馈。

Aug, 2022

零射语言代理用于带有结构反射的计算机控制

通过自反思和结构化思考管理，我们的零 - shot 代理在简单的 MiniWoB++ 任务中表现出更高效的推理能力，并且在复杂的任务中能够与之前的最佳模型相媲美，尽管之前的研究可以访问专家示例或额外的屏幕信息。

Oct, 2023

重新思考 Few-shot 视觉语言转换学习的任务抽样

提出了一种新的模型无关多任务微调算法（MAMF）并探究了任务抽样对于有效进行少样本学习的影响，表明 MAMF 在五个少样本视觉语言分类任务上表现比经典的微调更佳，旨在为少样本学习提供新的见解，并鼓励探究更好的任务抽样策略。

Mar, 2022

少样本团队合作

介绍了 few-shot teamwork（FST）问题，探讨了如何解决训练团队完成复杂任务所需的经验和与陌生队友合作完成新任务的问题，并指出其对多智能体强化学习和临时团队合作的影响。

Jul, 2022