- 叙事背景的图表示:通过回顾性问题实现连贯依赖
通过利用 NARCO 图,在叙事理解中提供了一种新颖且实用的范式,其通过形成图表并描绘整个上下文的任务无关的连贯依赖关系,从而实现了回顾性自由形式问题、局部上下文扩充和广泛的应用。实验表明,利用 NARCO 的方法在所有三个任务中均提高了性 - MouSi:多视觉专家视觉语言模型
使用集成专家技术,从不同的视觉编码器中协同能力,通过融合网络统一处理来自不同视觉专家的输出,并解决图像编码器和预训练 LLMs 之间的差距,同时探索不同的位置编码方案以解决位置溢出和长度限制问题,实验证明,具有多个专家的 VLMs 在性能上 - 自我监督特征适应用于三维工业异常检测
通过多模态数据和自监督特征适应方法,本文在工业异常检测领域提出了一种局部到全局的自适应特征调整方法,显著提高了特征嵌入方法的性能,并取得了超越之前最先进方法的显著成果。
- 将图形与大型语言模型融合:方法与前景
大型语言模型与图结构化数据的集成可以通过增强现有图算法和作为预测模型来提升性能,同时结合图结构可以在各种复杂任务中显著改善大型语言模型的表现。
- CARLG:利用上下文线索和角色关联提高文档级事件论元提取
我们提出了 CARLG 模型,通过利用上下文线索和角色相关性,有效改进文档级事件论证提取,实验证明 CARLG 模型在多个数据集上优于现有方法,并且推理时间缩短了 31%。
- 视觉与语言跨语言迁移的元学习
本文提出的元学习微调框架可提高目前状态下的预训练视觉语言模型在跨语言多模态场景下的适应性和性能表现,实验证明该方法在跨语言零样本和少样本多模态交叉迁移的场景下均可提高模型性能。
- FaceFusion: 利用多个数据集的全光谱实现
文章介绍了一种新的训练方法 FaceFusion,它创建了不同数据集的融合视图,同时使用端到端的方式训练嵌入网络,这样能够针对整个不同数据集的频谱提高性能。实验证实了我们的方法的卓越性能,超过了使用单个训练数据集以及以前已知方法在各种训练情 - 完整缺失的一半:通过多样化增强聚合过滤方法,增强图卷积神经网络
本篇论文提出通过增加双通道筛选器以替换传统图神经网络中的聚合操作,从而避免节点表示逐渐失去其标识并变得不可区分,最终在 9 个节点分类任务上获得了显著的表现提升。
- AAAI基于因果学的干预性知识蒸馏:解融法用于小样本目标检测
本研究介绍了一种基于结构因果模型的退门调整式知识蒸馏方法,称为 Disentangle and Remerge(D&R),可用于针对 few-shot 目标检测任务的条件因果干预。 实验结果表明,D&R 可以显著提高 few-shot 目标 - LOPS: 基于学习顺序灵感的弱监督文本分类伪标签选择
基于学习顺序的 LOPS 算法优化了基于伪标签的弱监督文本分类方法,通过选择先学的伪标签对模型进行训练,提高模型性能。
- 基于时空图的行人轨迹预测的元路径分析
本文提出了一种基于元路径的特征提取方法,用于改善现有 ST-graph 模型在交通预测、人体动作建模等领域表现不佳的问题,并在行人轨迹预测任务中应用,实现了比传统方法高 32% 的预测精度及更为社交化的轨迹。
- CVPRArtiBoost: 基于在线探索和合成技术提升带有关节的三维手 - 物体姿态估计
提出了一种名为 ArtiBoost 的轻量级在线数据增强方法,通过对合成手 - 物体配置和视点空间进行采样,可以覆盖多样的手 - 物体姿态和相机视点,并通过损失反馈和样本重新加权来自适应地丰富当前难以区分的项。该方法在几个手 - 物体基准测 - CVPR'2021 Kinetics-GEBD 挑战赛优胜:对比学习方法
本论文提出了一种基于对比学习的方法来解决通用事件边界检测(GEBD)的问题。通过使用时间自相似矩阵(Temporal Self-similarity Matrix)来作为信息瓶颈,该方法能够有效地提高模型性能并准确地检测到事件边界。
- 多模态对话生成中的文本视觉相互依赖建模
该论文提出了一种解决多模态对话生成的方法,可以更好地模拟真实环境中的多模态对话。通过建模文本 - 视觉特征之间的相互依赖,并研究生成与视觉背景相关的对话,大幅提升了模型性能。
- ECCV视觉语言导航的主动信息收集
该研究提出了一种基于人类导航行为的智能视觉语言导航策略,通过赋予代理人主动信息收集能力和学习探索策略来解决当前方法产生的不确定性问题和效率低下问题,实验证明该方法能显著提高导航性能。
- ACL填空题:无需人工评估的文档摘要质量评估
BLANC 是一种自动评估文档摘要质量的新方法,它利用预训练的语言模型衡量摘要对文档理解任务的性能提升来实现对功能性表现的客观、可重复和完全自动化的度量,并在不需要参考摘要的情况下实现了完全无需人类干预的摘要质量评估。
- 数据失衡的 NLP 任务的 Dice Loss
本研究提出了一种新的 dice loss 网络训练目标替代 cross-entropy 目标,以解决 NLP 任务中数据失衡的问题,并且在多项任务中均取得了显著的性能提升。
- IJCAI序列关系中的冲突作为注意力的反向
本论文提出了一种类似于注意力机制的 “冲突模型”,强调序列间的排斥关系,通过实验表明该模型与注意力机制结合可以提高整体性能。
- Banach Wasserstein GAN
本研究探索了 Wasserstein 生成对抗网络在巴拿赫空间中引入梯度惩罚后的理论扩展和一些具体选择的基础点,重点关注 Sobolev 范数,并在 CIFAR-10 和 CelebA 中展示了性能提升。
- EMNLP使用基于论点的特征预测和分析评论的有用程度
本研究探讨了如何在产品评论中识别有用的评论,并验证了基于论证的特征,如论证句子的百分比和依据结论的比率等,对于确定较佳评论的重要性。实验表明,与基准特征相结合使用时,基于论证的特征可使性能提高 11.01%。