- 多跳问题回答在时间知识编辑下的应用
多跳问题回答(MQA)与知识编辑(KE)相结合的研究引起了广泛关注,然而现有的 MQA 模型在处理带有明确时间背景的问题时性能较差。为了解决这一限制,我们提出了一种新的框架,即 TEMPLE-MQA,通过构建时间感知图(TAG)来有效区分问 - 图像超分辨率中利用自监督约束
本篇论文介绍了一种新的自我监督约束方法,称为 SSC-SR,用于单幅图像超分辨率处理。该方法采用双向不对称模式和指数移动平均更新目标模型以增强稳定性,能够插入已有的超分辨率模型并在多个基准数据集上实现显著的性能提升。
- 一种快速模型选择的两阶段召回和选择框架
提出了一种基于两阶段模型选择框架的方法,通过利用基准数据集上模型的训练性能来提高选择强大模型的效率,实验证明该方法让模型的选择速度比传统基准方法快 3 倍。
- 点云 - 文本匹配:基准数据集与基线
本文提出和研究了一种新的实例级检索任务:点云 - 文本匹配 (PTM),该任务旨在找到与给定的点云查询或文本查询匹配的确切跨模态实例。我们构建了三个新的 PTM 基准数据集,分别是 3D2T-SR、3D2T-NR 和 3D2T-QA。为了解 - ICLRPhoWhisper: 越南的自动语音识别
通过在多样化的越南口音的 844 小时数据集上微调 Whisper 模型,我们介绍了 PhoWhisper 的五个版本,实验研究表明 PhoWhisper 在基准越南自动语音识别数据集上具有最先进的性能。
- 多标签自适应批量选择:突出困难和不平衡样本
深度神经网络模型对多标签数据进行分类,然而在构建小批量时,类别不平衡导致模型对多数标签偏向,本研究引入了适用于多标签深度学习模型的简单且有效的自适应批量选择算法,优先选择与少数标签相关的困难样本,实验证明我们的方法比随机批量选择更快地收敛并 - CVPR通过扩散特征聚合进行物体姿态估计
基于扩散模型的对象姿态估计方法具有较强的泛化能力,优于目前最先进的方法,并在未见过的对象上取得了 98.2% 的准确率,证明了该方法的强大通用性。
- 保护 GNNs:基于说明的检测带后门的训练图
通过开发新的度量方法,探测 Graph Neural Networks 中的后门攻击,并在多个基准数据集上进行测试,取得了较高的检测性能。
- CVPR文本是 MASS: 用于文本 - 视频检索的随机嵌入建模
该研究提出了一种新的文本建模方法 T-MASS,通过将文本建模为随机嵌入,丰富了文本嵌入的语义范围,并在准确检索时利用了文本质量,从而在五个基准数据集上取得了最先进的性能。
- SIGIRChroniclingAmericaQA:基于历史美国报纸页面的大规模问题回答数据集
基于历史报纸收藏物 Chronicling America 构建的大规模数据集 ChroniclingAmericaQA 是用于问题回答和机器阅读理解任务的独特而有用的资源。
- Forest-ORE:挖掘最佳规则集合解释随机森林模型
通过优化的规则集合 (ORE) 使随机森林 (RF) 变得可解释,通过权衡预测性能、可解释性覆盖率和模型大小的权衡,提供了优秀的预测性能、可解释性覆盖率和模型大小的平衡。
- 一种高效的领域无关的监督关键词抽取和排序方法
我们提出了一种基于监督学习的自动提取文档关键词短语的方法,该方法利用候选短语的简单计算的统计和位置特征,不依赖于任何外部知识库、预训练的语言模型或词嵌入。在基准数据集上的评估显示,我们的方法达到了明显较高的准确性,相对于包括所有基于深度学习 - 一点点泄漏将毁掉一艘巨舰:从头到尾的大语言模型透明度调查
大型语言模型存在泄漏风险,可能泄漏个人信息、侵犯版权以及评估数据集,本文通过实验调查泄漏数据比例与输出速率、检测性能之间的关系,并提出了一种自检测方法,结果显示即使训练数据中含有少量泄漏数据,大型语言模型仍能产生大量的泄漏信息,而我们的自检 - 一个开放世界、多样化、跨时空的动态野外人员再识别基准
通过开展多样性的采集场景、光照变化、人物状态和保护隐私等方面的数据收集和处理,以及提出潜在域扩展方法来改进人物再识别模型的泛化能力。
- 少样本增量学习的技巧集合
我们提出了一个用于少样本类级增量学习(FSCIL)的绝招框架,这是一种具有挑战性的持续学习形式,涉及对有限样本的新任务的连续适应。我们的提出的绝招集合了八个关键而高度有影响力的技巧,改善了 FSCIL 的稳定性,适应性和整体性能,并建立了新 - 利用高分辨率特征优化基于深度哈希的图像检索
深度哈希技术利用高分辨率特征提取的高分辨率哈希网络(HHNet)在复杂数据集上显示出优于现有方法的性能提升,强调了在复杂图像检索任务中学习高分辨率特征的必要性。
- 生成文本流中的漂移方法
本文提供了四种文本漂移生成方法,以便生成带有标记漂移的数据集,并使用增量分类器测试它们恢复漂移的能力。结果表明,所有方法在漂移后性能都有所下降,增量支持向量机在准确性和宏 F1 得分方面运行速度最快,恢复了之前的性能水平。
- 评估文本到图像合成:图像质量指标的调查和分类
最近的文本到图像合成研究利用语言和视觉结合的基础模型取得了突破。为了确保文本和图像之间的内容对齐,研究人员开发了新的评估指标,通过收集带有复杂注释的数据集来研究视觉 - 语言模型的组合性以及作为内容对齐质量度量的能力。本文全面介绍了现有的文 - CoroNetGAN: 通过超网络控制 GAN 的剪枝
提出了一种利用可微的修剪方法通过超网络压缩 GAN 的方法,实现可控压缩训练,并在多个基准数据集上取得了优异的性能。
- 基于傅里叶变换的领域自适应框架
使用傅里叶方法(FTF)改善无监督领域适应性,通过融合傅里叶域中源域和目标域的振幅,将目标域的低级信息有效地整合到源域中,并引入相关性对齐的概念进一步调整多源数据,以实现卓越的性能。