- 有限制的教师监督下的解码需要理解何时信任教师
发展一种能够有效聚合 sLLM 和 LLM 在初始度上的预测结果以便后续由 sLLM 生成的标记能更准确影响,通过对 sLLM 的置信度自适应性地超信任或忽略 LLM 的预测,我们证明我们的方法在各种模型和数据集上提供了一致的改进。
- 基于单调变分不等式的非线性时序嵌入
通过无监督学习非线性时间序列的低维表示方法,该方法基于每个序列服从自身的自回归模型并通过低秩约束与其他序列相关联的假设,可以用于聚类和分类等机器学习任务,并且在真实时间序列数据上展示了有竞争力的性能和符号文本建模和 RNA 序列聚类的有效性 - MCGAN:基于回归的生成器损失增强的 GAN 训练
生成对抗网络(GAN)已经成为一种生成高保真数据的强大工具,并且采用监督方法提出了 Monte Carlo GAN(MCGAN)算法,以解决现有方法在生成器训练上缺乏监督导致的振荡与性能不佳的问题,并且数值结果表明 MCGAN 在质量、准确 - 描述 - 理由:通过视觉理解训练改进多模态数学推理
通过视觉理解训练和数学推理学习,我们提出了一种名为 VCAR 的两步训练方法,以改善多模态大型语言模型在复杂数学推理中的表现。实验证明,VCAR 在高视觉要求的问题上明显优于仅依赖推理监督的基线方法。
- 神奇修复:通过观察动态视频简化照片编辑
我们提出了一个生成模型,根据粗略编辑的图片合成一个遵循预定布局的逼真输出,并从原始图像中转移细节,同时保留其部分的身份信息,并将其调整到由新布局定义的光照和上下文。
- TELEClass: 在最小监督下的分类法丰富和 LLM 增强的分层文本分类
通过自动丰富标签分类法和利用大型语言模型来进行弱监督的分层文本分类,我们的方法 TELEClass 在两个公共数据集上表现优于先前的弱监督分层文本分类方法和基于零样本提示的大型语言模型方法。
- 无任务名称的上下文注入用于程序规划
本研究探讨了在教学视频中的过程规划挑战,旨在通过观察视频中的视觉起点和目标,创建目标导向的计划。在先前的研究中,通过从大量的中间视觉观察或语言指令逐渐减少训练监督来解决此问题。然而,随着大型语言模型的出现,即使只提供任务名称,这些模型也可以 - 无配对掩码 - 文本监督下的开放词汇分割
使用独立的图像 - 蒙版和图像 - 文本对,利用不配对的蒙版 - 文本监督,提出了一种新的弱监督开放词汇分割框架 (Uni-OVSeg),通过利用自信的蒙版预测和文本描述中的实体,在 CLIP 嵌入空间中关联一组二进制蒙版和实体,采用大型视 - ACL利用对比学习提高基于令牌的上下文表示的效果:注入维基词典
我们调查了如何通过英语 Wiktionary 作为替代监督源来注入词汇,并测试了降维对生成的上下文词嵌入的影响。通过在无监督设置下(不使用训练集),我们在 Word-In-Context(WiC)任务中取得了新的 SoTA 结果,并提出了两 - MS-DETR: 使用混合监督实现高效的 DETR 训练
改进了 DETR 训练效率,通过使用混合的一对一和一对多监督来明确监督候选生成过程,而无需额外的解码器分支或对象查询。
- 基于红外人数统计的监督级别权衡评估
研究探讨了使用较弱监督水平对深度人数计数体系结构在图像分类和点级定位方面的性能造成的影响,实验证明使用 CNN 图像级模型计数人数能够以竞争性结果达到 YOLO 检测器和点级模型的水平,并且提供更高的帧率和相似数量的模型参数。
- EMNLP计算立场检测的多标签和多目标机器注释采样
研究了利用大型语言模型进行自动标注来进行计算立场检测,引入了多标签和多目标采样策略以优化标注质量,实验证明该方法能明显提高性能和学习效果。
- 利用不完美监督的学习方法进行现实世界图像除雾
通过一种统一的方法来解决现实世界中图像去天气问题中的不一致性,并通过信息分配策略(IAS)联合监督去天气模型,从而提高现有去天气模型的性能。
- EMNLPSeq2seq 对于共指解析的全部需求
本研究中,我们证明 task-specific 模型并非必需,通过微调预训练的 seq2seq transformer,将输入文档映射为编码指示共指标注的标记序列,我们的模型在多个数据集上表现优于或接近文献中最佳的共指系统。我们还提出了一种 - 基于结构感知图学习的正无标签节点分类
本文提出了一种利用图结构进行正样本 - 未标记样本节点分类的方法,通过引入图中的同类偏执(homophily)来增加准确的监督信息,并提出了一种正则化项,以使模型与图结构对齐。理论分析表明,最小化所提出的损失函数也同时最小化了期望损失,可适 - 无细粒度标签的多方面情感分析的文档级监督
基于 VAE 的主题建模方法,利用文档级别的监督,在不需要精细标注方面或情感方面的标签的情况下完成 ABSA,能够检测文档中的多个方面,从而合理推测多个方面的情感是如何融合形成可观察的整体文档级情感的。通过对两个不同领域的基准数据集的实验结 - 医学图像分析的高效数据深度学习:综述
进行全面回顾医学图像分析数据有效深度学习方法,将其按照所依赖的监督水平进行分类,并进一步细分为多个子类,研究常用的数据集和未来的研究方向。
- 通过互动学习物体的几何表示
从不受限制的各种观测中提取代理和外部物体在物理空间中的位置的表示学习框架,仅依靠代理执行的动作作为唯一的监督信号,并假设物体通过未知动力学被代理移动,能够确保从中推断出等度量表示,并正确提取它们的位置。
- 复杂系统中的无监督学习
本论文探讨了利用复杂系统研究自然和人工系统的学习和适应能力,旨在开发能够无需监督学习、自主发展并随时间变得越来越复杂的自主系统。复杂系统被视为理解这些现象的适当框架,因其能够展现复杂性的增长能力。通过理解复杂系统中学习的基本原理,我们希望能 - 无源域适应的可靠像素级标签生成
该论文提出了一种简单而新颖的图像翻译工作流程 ReGEN,以解决领域自适应设置中标记源域数据集仅来自预训练黑盒分割模型的问题。