- IEPile: 挖掘大规模基于模式的信息抽取语料库
通过构建综合的双语(英语和汉语)信息抽取指示语料库 IEPile,可以提高大语言模型在信息抽取中的性能,尤其是零样本泛化能力。
- ACL三重编码器:共同激活的表示共同连接
通过基于搜索的对话模型和曲线对比学习,引入三重编码器来有效地计算独立编码的话语的混合分布,通过一种新颖的 Hebbian 启发的共现学习目标,实现了高效计算,而无需重新编码,从而实现了更好的零样例泛化。
- 多模态大型语言模型的样本外广义推广
通过广泛的评估工作,我们研究了当前多模态大型语言模型在超出分布情景和特定领域任务下的泛化边界。实证结果表明,多模态大型语言模型在常见训练域之外的泛化上存在困难,需要经过适应性的直接应用。我们进一步探索了上下文学习在分布偏移下的鲁棒性,并展示 - 学会在专业专家之间进行零 - shot 泛化中的路由
通过 PHATGOOSE 方法,我们提出一种后期自适应分词控制,以改善零样本泛化到未见任务,并发现其优于先前的方法和显式多任务训练。
- ICLR通过符号方程学习生成灵活的黑盒优化器
通过符号方程学习,本文提出了一种名为 Symbol 的新框架,自动发现黑盒优化器,并通过深度强化学习的方式进行元学习,实现了超越现有基准模型的优化器,并展现了卓越的零样本泛化能力。
- 大语言模型标注资源节约的有监督微调实验设计框架
我们提出使用实验设计来缓解 SFT 的标注成本,并避免在 LLM 的背景下应用主动学习的计算瓶颈。我们的方法在生成任务中实现了与随机抽样所需注释成本相同的泛化性能,仅需 50% 的注释成本。
- 机器生成指令的效果
机器生成的注释是一种资源和成本效益高的微调下游模型的方式。
- 通过潜在走廊进行自适应人类轨迹预测
使用可学习的图像提示将预训练的人体轨迹预测器的输入增强,从而使预测器能够从极少量的新数据中推断出部署场景的趋势,从而解决特定场景下的人体轨迹预测问题。
- MuRF:多基线辐射场
我们提出了多基线辐射场(MuRF),这是一种解决在多个不同基线设置(小和大基线以及不同数量的输入视图)下的稀疏视图合成的通用前向方法。通过将三维空间离散化为与目标图像平面平行的平面,并相应地构建目标视图截锥体,以呈现目标新视图。这种目标体积 - 提升分段通用模型以实现开放词汇学习
本研究旨在无缝地将 Segment Anything Model (SAM) 与开放词汇目标检测器集成在一起,引入了 SideFormer 模块和开放区域建议网络 (Open-set RPN) 等创新方法,以提升 SAM 在检测任意对象和开 - 基于大型模型的指代伪装物体检测
提出一种基于大型模型的多层次知识引导的多模态方法,用于参考化伪装目标检测(Ref-COD),实现语义智能和内在知识的全面利用,达到了与参考相对应的伪装目标和伪装场景的渐进感知,并深度对齐文本参考与伪装照片。
- VSCode:基于 2D 提示学习的通用视觉突显和伪装物体检测
基于 VSCode 模型和 2D prompt 学习的引入,共同解决了四个显著目标检测任务和三个伪装目标检测任务,实现了在 26 个数据集上六个任务的最优结果,并通过结合 2D prompts,如 RGB-D COD,呈现了对未见任务的零样 - 回归基础:提升密集编码器领域外检索的简单方法
通过改进训练过程,使用参数高效的方法和适当的负样本,可以提高密集编码器在训练时的泛化能力,从而在单一数据集上训练时实现有效的泛化。
- 神经逻辑人 - 物体交互检测
使用神经逻辑推理和 Transformer 来推断实体之间的可行互动,通过改进 Transformer 的自注意机制,使用逻辑约束学习过程,提高性能和零样本泛化能力。
- 自适应递归视觉执行零样本计算,以适应未见困难程度的扩展
通過使用自適應遞歸神經網絡,我們研究了可根據輸入要求動態分配計算資源的遞歸處理,在視覺推理問題中實現了對更困難程度的一般化,而無需訓練。
- 一个简单而高效的集成方法用于 AI 生成文本检测
近期大型语言模型(LLMs)在各种风格和体裁的文本生成方面展示了惊人的能力。然而,这种能力容易被滥用,如虚假新闻生成、垃圾电子邮件创建以及在学术作业中的误用。因此,建立能够区分人工生成文本和人类作者文本的自动化方法至关重要。本文提出了一种简 - 对齐您的提示:基于分布对齐的零样本泛化的测试时提示
通过减小分布偏移,将零样本泛化的视觉 - 语言模型在未见领域中的性能提升了 3.08%,并且在跨数据集泛化的情况下,在所有数据集上相对于现有的最先进方法有一致的改进。
- 基于关键点集成的软动作者 - 评论高斯混合模型的机器人技能推广
我们通过将模仿和强化学习范式相结合,开发了一种学习和适应技能的混合模型,通过学习动态系统的关键点,利用机器人在技能学习过程中的视觉观察,预测场景内的参考点,从而实现机器人在新环境中的零样本泛化能力和在目标环境中更快地优化技能的目标,同时能有 - 多模态语言模型的性能评估
该研究分析了不同的多模态指导调优方法,并评估了它们在复杂推理、对话、图像字幕、多项选择题和二元分类等任务中的性能,揭示了在将多模态能力融入大型语言模型时的架构选择的关键见解,但当前方法存在局限性,未能充分解决丰富多样的多模态指导数据集的需求 - 结合时空抽象以实现更好的泛化规划
Skipper 是一个受人类有意识规划启发的基于模型的强化学习代理,利用空间和时间抽象来在新情境中推广学到的技能,通过自动将任务分解为更小、更可管理的子任务来实现稀疏决策,并将计算集中在环境相关的部分。与现有的基于层次规划的方法相比,基于图