- 令人尴尬地简单文本水印
Easymark 是一种简单且有效的文本水印方法,可以在不改变文本意义的情况下注入水印,并能高效可靠地检测是否由采用 Easymark 的系统生成的文本,实验证明 Easymark 在检测准确性和 BLEU 分数方面优于现有的文本水印方法。
- 基于自然语言的增强式偏好学习
使用大型语言模型(LLM)进行比较文本分类任务,不需微调,性能优于现有方法,特别是在较长的文本中。零样本学习的性能不如少样本学习。
- ACL利用语境线索和角色相关性增强文档级事件论元抽取
本文提出了一种 SCPRG(Span-trigger-based Contextual Pooling and latent Role Guidance)模型,它包含两个新颖有效的模块,用于解决文档级事件论证提取的问题,并在公共数据集上表现 - AAAIPrototypeFormer: 学习探索原型关系进行少样本图像分类
本文提出了一种名为 PrototypeFormer 的方法,通过探索原型关系,显著改进了传统的少样本图像分类方法。该方法采用变压器架构构建原型提取模块,旨在提取更具有区分性的类别表示,以用于少样本分类。此外,在模型训练过程中,提出了一种基于 - 基于场景感知的人体动作预测与互相距离预测
本文介绍了一种关于场景感知的三维人体动作预测的方法,通过建模人与场景之间的相互作用,通过人与场景之间的相互距离来约束人体的局部和全局运动,提出的方法在合成和真实数据集上的表现优于现有方法。
- 不一致性问题的重要性:从不一致的解码器特征中学习以实现一致的半监督医学图像分割
我们提出了一种名为 LeFeD 的半监督学习方法,通过训练差异化的解码器并从不一致的信息中学习,学习来自两个解码器的特征级差异,并将差异作为反馈信号馈送到编码器中,从而在三个公共数据集上取得了超越竞争对手的结果,为半监督医学图像分割设定了新 - ICCV视频文本检索的统一粗细对齐
通过联合考虑不同粒度的跨模态相似性,我们提出了一种统一的多粒度对齐模型 UCoFiA,显著优于以前的基于 CLIP 方法,在多个视频 - 文本检索基准上表现出了 2.4%,1.4%和 1.3%的文本到视频检索 R@1 改进。
- 在图嵌入中平衡本地和全局结构(LGS)
通过可调参数,在图嵌入中实现局部和全局结构之间的平衡,以便在二维图上有效地捕捉局部和全局信息。使用综合质量指标评估了该方法的性能,结果表明其与最先进的方法竞争力相当,包括应力、邻域保持等。引入了一种新的质量指标用于评估中间结构的保持,所有的 - 逐阶层小波优化细化扩散模型在稀疏视角 CT 重建中的应用
一项名为 SWORD(Stage-by-stage Wavelet Optimization Refinement Diffusion)模型的创新性方法被提出,用于稀疏视图 CT 重建。该方法结合了低频和高频生成模型,通过优化过程实现解决方 - 从像素到肖像:口头生成技术与应用的综合调研
这篇论文系统地研究了最新的深度学习和计算机视觉技术在逼真说话头部生成方面的方法,将它们分为图像驱动、音频驱动、视频驱动和其他(包括神经辐射场(NeRF)和基于 3D 的方法)四种主要方法,并深入分析每种方法的独特贡献、优势和局限性。此外,还 - PointHPS: 基于点云的级联三维人体姿态和形状估计
基于 3D 点云数据的 PointHPS 框架通过迭代的特征提取和处理方案,在人体姿势和形状估计的研究领域中具有显著优势。
- MMCgT-GAN:基于 CLIP 引导的文本 GAN 用于图像字幕生成
提出了一个 CLIP 引导的文本生成对抗网络 (CgT-GAN) 模型,通过引入图像数据进行训练,结合语义指导奖励 (CLIP-based reward) 和生成文本的自然度奖励来生成与外部语料库相似的文字。在实验证明,CgT-GAN 在各 - ICCVSILT: 基于阴影感知的迭代标签调整用于学习从噪声标签中检测阴影
提出了基于 SILT 的阴影感知迭代标签调整框架,通过将强数据增强与阴影伪造相结合,采用全局 - 局部融合和阴影感知过滤的简单且有效的标签调整策略,以从噪声标签中让网络进行重要的改进,实验证明使用 SILT 训练的简单 U-Net 模型在阴 - ICCV深入研究单目三维物体跟踪中的动作感知匹配
提出了一种基于运动感知的单目三维多目标跟踪(MoMA-M3T)框架,通过在时间帧内捕捉物体的运动线索,将历史物体轨迹与当前观察结果进行匹配,实现与最先进方法相媲美的性能。
- 用学习对手稳定非监督环境设计
训练任务、无监督环境设计、PARED、最新方法、开放式强化学习训练。
- AAFACE: 面部识别的属性感知注意力网络
我们提出了一种新的多分支神经网络,同时作为辅助模态进行软生物测量预测并作为主任务进行人脸识别。我们的网络 AAFace 利用软生物测量属性来增强人脸识别表征的区分能力,并通过属性感知注意整合模块(AAI)对人脸识别与软生物测量特征图进行加权 - ICCVRMP-Loss: 正则化脉冲神经网络的膜电位分布
我们提出了一种调节与量化误差密切相关的分布范围接近于脉冲的正则化膜电位损失 (RMP-Loss) 的方法,该方法非常简单易于实现和训练 SNN,并且在不同网络架构和数据集上始终表现优于以往的最先进方法。
- 基于跨模态迁移网络的不确定性感知的基于手绘的 3D 形状检索
本文介绍了一种基于不确定性感知的跨模态转换网络 (UACTN),用于处理手绘数据中的低质量和噪声样本,并通过实验和对比研究表明其在与现有方法相比的优越性。
- 统计异质性实验设计下联邦学习的实用方案
Federated Learning 的研究中,我们进行了关于实验变量的全面研究,提出了一些见解和建议,并发布了 FedZoo-Bench 库,包括 22 个最新方法的预实现,以及一套标准化和可定制化的特性。我们还对几种最新方法进行了全面比 - 多保护属性下公平性改善的实证研究
该研究论文对多个受保护属性的公平性改进进行了广泛研究,涵盖了 11 种最先进的公平性改进方法。结果显示,针对单个受保护属性改进公平性会大幅降低对未考虑的受保护属性的公平性。此外,在处理多个受保护属性时,精确率和召回率的影响是单个属性的 5