- ICCVPatchCT:使用条件传输将分割集和标签集对齐,用于多标签图像分类
本研究论文探讨了多标签图像分类问题,介绍了条件传输理论以弥合视觉补丁和语义标签之间的潜在空间的语义一致性差距,并将多标签分类问题重新表示为条件传输问题。实验证明,该模型在三个公共图像基准任务中 consistently outperform - 知识增强:重新思考医学对比视觉 - 语言预训练
本文提出了一种知识增强的对比视觉语言预训练(KoBo)框架,该框架将临床知识整合进视觉语言语义一致性的学习中,从而应用于分类、分割、提取和语义相关性的任务中,具有与零样本或少样本设置相当或更好的性能。
- 基于语义一致性重编码变分自编码器的单类别新奇检测
本文介绍了一种利用重建模型的潜在空间,结合重新编码机制和语义一致性限制的 Novelty Detection 算法,分为正常、异常和不确定语义区域,并提出了三种训练模式。 实验结果表明,该算法在多个数据集上优于其他算法,达到了当前最先进水平 - 具有语义感知先验的可控一次性人脸视频合成
使用人脸先验信息的新方法,通过对源面部解析并对其几何形状进行正则化,可以在可接受的带宽下生成带有改善的语义一致性和表情保持的面部视频,并实现高度可控的姿态和表情生成。
- CVPR利用隐藏正样本进行无监督语义分割
通过挖掘隐藏正样本学习丰富的语义关系和确保局部语义一致性,我们引入了对比学习来解决任务特定训练指导和局部语义一致性缺乏考虑的问题,并引入了一个渐进的策略来逐步提高导致模型捕获任务特定的语义特征,在 COCO-stuff、Cityscapes - VideoXum: 视频的跨模态视觉和文本摘要
我们提出了一个新的联合视频和文本摘要任务,旨在生成一个缩短的视频剪辑和相应的文本摘要,我们通过构建一个大规模的人类注释数据集 - VideXum 来解决此问题,并使用新的度量标准 VT-CLIPScore 来评估跨模态摘要的语义一致性。我们 - 基于多视角语义一致性的信息瓶颈聚类方法
提出了一种新的多视角语义一致性信息瓶颈聚类(MSCIB)算法,通过语义空间的多视角映射对多源信息进行对齐,从而获取有价值的一致信息,已取得最先进的性能。
- 语义辅助音频分类框架
本文提出了一个语义辅助的音频分类框架 SemanticAC,它通过利用标签中的语义信息,保证音频信号与标签之间的语义一致性,从而实现更好的性能。通过在 ESC-50 和 US8K 两个音频数据集上进行广泛实验,验证了该方法能够持续优于其他音 - ROSCOE: 评分逐步推理的一套度量指标
本研究提出了 ROSCOE,这是一种可解释且无监督的自动评分方法,可以测量大型语言模型的语义连贯性,逻辑性,信息量,流畅度和事实性,分别针对人类注释和程序干扰的诊断数据集进行了实证验证并证明其效果优于基线方法。
- 可微模糊 ALC: 一种神经符号表示语言用于符号基础模型
本文提出了可微模糊 ALC 作为神经符号表示语言并定义层次化损失和基于规则的损失函数用于符号接地问题的 DF-ALC,其实验结果表明 DF-ALC 可以以无监督的方式改善图像目标检测器的性能,即使在低资源情况下。
- 通过语义一致性衡量大型语言模型的可靠性
本研究针对更新的预训练语言模型(PLMs)在语义一致性方面的问题,提出了一种衡量语义一致性的度量标准,并在 TruthfulQA 数据集上评估多个 PLMs 的性能,发现我们提出的语义一致性度量标准比传统的基于词汇一致性的度量标准更可靠,也 - 神经文本生成需求对比搜索
本研究评估了 16 种主要语言的自回归 LMs 的各向同性,并推出一个校准自回归 LMs 表示的对比学习方案,并基于此方案提出了一种新的解码方法,称为对比搜索,它在各种各样的基准测试中取得了最新的成果,显示出其高度的性能,无需任何附加的训练 - 利用视频级事件语义一致性实现音视频事件定位
本文提出了一种新颖的视频级语义一致性引导网络,包括事件语义一致性建模模块和两个组件,交叉模态事件表示提取器和内部模态语义一致性增强器,同时增加负样本对过滤损失和平滑损失来进一步提高方法的有效性,以在 AVE 数据集上优于当前最先进的方法,在 - SDA: 简单离散增强方法用于对比句子表示学习
本文提出三种离散级别的语句数据增强方法(标点符号插入、肯定助动词和双重否定),以实现语义一致性和表达多样性的平衡,从而取得了良好的效果,并在英文和中文语义文本相似性数据集上进行了广泛的实验。
- COLING基于条件掩码语言模型的神经机器翻译语义一致数据增强
本文介绍了一种新的神经机器翻译数据增强方法,可以在语言内外强制实现更强的语义一致性。结果表明,条件掩蔽语言模型是一种生成上下文相关单词分布的有效技术,并集成了软词替换的思想,以增强数据多样性,加强语义一致性。该方法在四个规模不同的翻译数据集 - 上下文中的迷失?关于上下文化词向量的意义差异
揭示了上下文化单词嵌入的一些特征,包括上下文中单词意思的变化程度,单词在不同上下文中的一致性,以及单词位置偏差的影响,并提出一种减轻这种偏差的简单方法。
- BIC: 基于文本图交互和语义一致性的 Twitter 机器人检测
本文提出了一种名为 BIC 的 Twitter 机器人检测框架,其使用文本和图形交互和语义一致性建模进行 Twitter 机器人检测,并取得了比现有方法更好的效果。
- 基于记忆的文本到图像生成
提出了一种基于记忆驱动的半参数方法来进行文本生成图像,这种方法基于参数和非参数技术,其中非参数部分是图像特征的记忆库,而参数化部分是生成敌对网络。实验结果表明,所提出的记忆驱动半参数方法在视觉保真度和文本图像语义一致性方面比纯参数方法产生更 - ACL具有语法控制的知识图谱生成语言文本:顺序和语义一致性
本文通过优化基于语序监督的知识描述顺序预测和使用句法和语义正则化进一步提高生成的句子和知识图谱的一致性,以实现易于理解的知识图谱生成任务,并通过语法和语义约束获取了最先进的性能。
- ACLEPiDA:一个易于插件化的数据增强框架,用于高性能文本分类
本文提出了一种易于使用的、支持有效文本分类的数据增强框架 EPiDA,它利用相对熵极大化和条件熵最小化来控制数据生成,其中相对熵用于增强数据的多样性,而条件熵则用于确保其语义一致性。实验结果表明,EPiDA 在大多数情况下优于现有的最先进方