- GeoBench:单目几何估计模型的基准测试与分析
通过构建统一的评估基准和使用高质量的合成数据,我们发现使用大规模数据进行微调的判别模型,如 DINOv2,可以在相同的训练配置下,通过较少量的高质量合成数据超越生成对应物,这表明微调数据的质量比数据规模和模型架构更重要。这项研究对几何估计任 - ANLS*- 生成式大语言模型通用文档处理度量
该论文介绍了一种用于评估生成模型的新度量指标 ANLS*,扩展了现有的 ANLS 度量,适用于信息提取和分类等各种任务,并通过评估 7 个不同数据集和 3 个不同的生成模型,证明了该度量指标的重要性。此外,还对一种新型的文档提示生成技术 S - AAAI探索开放集识别的多样化表示
基于对开集识别的理解并发现学习辅助表示可以从理论上降低开放空间风险,本文提出了一种名为多专家多样注意力融合(MEDAF)的新模型,该模型以辨别性方式学习多样的表示,通过多个学习的专家进行自适应融合,并使用评分函数来识别未知样本,实验证明该模 - ICLR有监督的知识提升大语言模型在上下文学习中的表现
通过提示工程,大型语言模型(LLMs)展示了在上下文学习中的新兴能力。最近在大规模生成模型方面的进展进一步扩展了它们在实际语言应用中的使用。然而,在自然语言理解和问题回答方面,提高 LLMs 的泛化能力和准确性的关键挑战仍未得到充分探索。
- 用户友好和适应性强的判别型人工智能:借鉴 LLMs 和图像生成模型的成功经验
我们开发了一种新的系统架构,使用户能够像使用生成式 AI 工具一样与判别模型(如目标检测、情感分类等)进行工作,用户可以轻松提供即时反馈并根据需要调整已部署的模型,从而提高这些传统预测模型的可信度、用户友好性和适应性。
- EMNLP基于预训练生成模型的问题回答适应性
本文介绍了一种新颖的方法,利用预训练的生成模型来解决抽取式問答任务,通过生成与回答的上下文标记或句子相对应的索引,实现了在多个抽取式問答数据集上优于现有 state-of-the-art 模型的卓越性能。
- Ref-Diff: 通过生成模型实现的零样本参考图像分割
本研究提出了一种用于零样本参照图像分割的新型方法 Ref-Diff,它利用生成模型中的细粒度多模态信息,证明仅凭生成模型的性能可以与现有的 SOTA 弱监督模型相媲美,并且当将生成模型与判别模型结合时,我们的 Ref-Diff 显著优于其他 - 改进基于生成模型的展开方法与 Schrödinger 桥
基于机器学习的展开研究区域中,基于判别模型和生成模型出现了两种主要方法。我们提出使用 Shroedinger Bridges 和扩散模型创建 SBUnfold,这种展开方法结合了判别模型和生成模型的优势,并在合成的 Z+jets 数据集上展 - 通过部分标签先验的隐含判别逼近进行生成式噪声标签学习
针对学习时标签存在噪声的问题,本研究提出了一种新的生成式噪声标签学习方法,通过直接关联数据和干净标签、使用判别模型隐式估计生成模型、以及借鉴部分标签学习的信息性标签先验,解决了现有方法中的三个问题,实验证明该生成模型在保持计算复杂度与判别模 - 视频自动欺诈检测:基于端到端学习的高级特征和分类方法
本文通过结合深度学习和判别模型提出了一种多模态方法用于自动检测欺诈,并且在五个数据集上进行了评估,结果表明基于面部表情的方法优于基于凝视和头部位置的方法,并且多模态方法与特征选择的结合可以提高检测性能。
- 利用去噪扩散概率模型检测面部混合攻击
本文介绍了一种基于扩散的新型高效 MAD 方法,学习纯粹的真实图像的特征,实现对不同形态的变形攻击的检测。在四个不同数据集上进行了严格的实验,并与现有解决方案进行了比较,结果表明我们的 MAD 模型在所有数据集上都取得了高竞争力的结果。
- 条件分布间的实证最优传输
本文研究了基于公共变量的两个联合分布的条件 Optimal Transportation 问题,提出了一种基于 Maximum Mean Discrepancy 的正则化器用于解决连续变量和分布不同的情况,进而实现了条件转移计划的估计和统计 - 基于高斯耦合 Softmax 层的生成模型和判别模型的混合
本论文提出了一种用于训练神经网络的生成模型和判别模型的混合方法,其中关键的想法在于高斯耦合 softmax 层,该层可以嵌入神经网络分类器中,允许分类器估计类的后验分布和类条件数据分布,而且该混合模型适用于半监督学习和置信度校准。
- 自协同学习:生成器与鉴别器之间的协作
本文提出了一种自洽学习的框架,利用生成对抗网络的生成模型和判别模型的博弈优化,使两者协同训练,避免了 GAN 训练不稳定的问题,并在句子语义匹配问题上实现了较好的性能。
- 基于高斯混合模型的生成式语义分割模型
GMMSeg 提出了一种使用密集生成分类器进行分割的新型分割模型,以捕获类条件密度并在具有各种分割架构和 Backbone 的情况下优于鉴别模型,即使在开放性的数据集上也表现良好。
- 判别模型在基于方面的情感分析中仍然可以优于生成模型
该研究评估了最先进的两种分类和生成模型的能力,结果表明,在跨语言,跨域和跨语言域等不同场景下,相较于生成模型,判别模型在大多数情况下仍然是更好的选择。
- 深度判别到核生成建模
该论文提出了一种 kernel generative networks 方法,将深度鉴别网络转换为核生成网络,实现了鉴别模型和生成模型的协同配合,探讨了在低维环境下两种模型的应用时的理论和经验表现,证明了它比对应的鉴别学习方法更有效,并可以 - 我是我还是你?现代对话模型无法维护身份
通过对话模型进行定量化和形式化,并且使用人类评估实验证明了角色身份维持的问题,提出了识别讲话者的判别模型,并评估了改变模型结构、训练协议和译码策略等多种缓解方法,发现最佳模型能够将身份混淆问题降低近 65% 同时提高参与度,但是维护角色身份 - ECCV使用自然语言描述纹理
本文研究了纹理的视觉属性及对不同模型的影响,发现现有的生成和判别模型不能很好地捕捉纹理的组成属性。我们以证据支持了此观点,并提供了可解释性的模型来生成基于语言的解释,以加深对纹理分类的理解。我们通过在 Caltech-UCSD 鸟类数据集上 - 论所学习表征的线性可辨识性
研究深度神经网络在表示学习中的可辨认性,并从非线性独立成分分析的角度提出一种恢复可辨认性的方法,提出了一系列充分条件和证据,证明一大类具有判别性的模型在功能空间上具有线性可辨认性。