- 语言引导的技能发现
使用大型语言模型的语义知识,Language Guided Skill Discovery (LGSD) 基于用户提示输出一组语义上独特的技能,使得四足机器人能够通过改变提示在平面上访问不同的用户预期区域,并且在机器人运动和操作环境中,与五 - 低资源开放领域对话生成的可控且多样化的数据增强
利用大规模语言模型 (LLM) 进行以摘要为基础的对话增强 (SDA) 以提高语义多样性和控制能力,通过生成高质量和多样化的对话数据来增强开放领域对话模型的性能。
- ICLR基于奖励引导的搜索的 ARGS 对齐
通过集成对齐到解码过程中,使用奖励信号调整模型的概率预测,ARGS 在不需要昂贵强化学习训练的情况下生成与人类偏好相一致的文本,提供了一种有前途且灵活的解决方案,以对齐语言模型。
- 高效 Transformer 的沙漏分词技术用于 3D 人体姿势估计
提出了一种基于 Transformer 的 3D 人体姿态估计的剪枝和恢复框架,通过选择具有高语义多样性和消除视频帧冗余的少量代表性 Token,在中间 Transformer 块中有效地提高模型效率。
- 通过文本到视频模型的调整实现多样和一致的音视频生成
生成多样化和逼真的视频,根据语义类别广泛的自然音频样本进行引导。采用了基于轻量级适配器网络的方法,将音频基础表示映射到文本 - 视频生成模型所期望的输入表示,实现了对文本、音频以及文本和音频的生成视频。在三个数据集上验证了该方法,展示了生成 - EMNLP对话生成语义多样性的测量和改进
本文提出了一种新的自动化评估指标,用于衡量生成响应的语义多样性,以及一种基于语义分布权重的学习方法,用于提高生成响应的语义多样性和连贯性。
- 多视角的语境常识推理:一个新的数据集和任务
该论文介绍了一个包含多种类型的文本解释的数据集 CICEROv2,提出了一系列的预训练目标来帮助下游任务。结果表明,该论文中的预训练目标对于预训练模型来说是有效的。
- ACL自然语言推理中的语义多样性
本文通过提出一种新的度量方法和一种称为 Diversity Threshold Generation 的新生成程序来改进对话生成,从而在多样性方面取得了显著进展。
- ECCV递归标签校准实现无数据神经架构搜索
本文以深度预训练神经网络为基础,探究如何通过数据恢复技术以及自主生成的语义与多样性丰富的合成数据,实现在保护隐私,避免偏见等现实场景下,无需使用原始训练数据进行神经结构搜索的可行性和效果,并发现合成数据的神经结构搜索表现不亚于以往使用原始数 - 语义多样性学习用于零样本多标签分类
该研究介绍一种用于多标签零样本学习的神经网络模型训练方法,该方法使用具有主要嵌入向量的嵌入矩阵并在训练期间加权损失函数以鼓励嵌入矩阵多样化,以提高基于标签的图像检索的零样本模型的质量。该方法在多个常见数据集(NUS-Wide,COCO, O - CVPR文本到图像生成的语义分离
该文提出了一种新的文本图像生成模型,使用基于语义的标准化处理和图像嵌入策略来实现高水平的语义一致性和低水平的语义多样性,并在 CUB 和 MS-COCO 数据集上展示了其优异性能。
- ACL基于照片的自然语言推理语料库
本文介绍了一个新数据集,包含 107292 个英语句子与网络照片的组合,任务是确定自然语言字幕是否与一对照片相符。数据要求包括数量、比较和关系等组成性联合推理的定性分析以及强大的视觉推理方法的评估。