BriefGPT.xyz
大模型
Ask
alpha
关键词
evaluation setup
搜索结果 - 5
ACL
针对恶意内容检测的社区模型普适性评估更加实际的设置
社区模型、恶意内容检测、社交网络、评估设置、少样本子图采样是本篇论文的关键词,该论文提出了一种基于少样本子图采样的新型评估设置,用于模型的泛化性能测试,并展示了相比传统社区模型,使用该方法训练的图元学习器在归纳设置中表现更好。
PDF
3 months ago
针对大规模扩散模型的更真实成员推断攻击
本文研究生成扩散模型的会员推断攻击,通过提出一种公正的评估框架,发现之前提出的评估机制无法充分了解该问题的有效性,因此揭示了该攻击仍然是大型扩散模型的难点,难以保护相关的隐私和版权问题。
PDF
a year ago
MM
图像字幕中检测识别外部分布的基线算法
本文探讨了图像标注中的 OOD 检测问题,并提出了评估模型性能的方法。此外,研究分析并展示了使用标题可能性得分来检测和拒绝 OOD 图像的有效性。
PDF
2 years ago
EMNLP
语言建模用于代码交替:评估、整合单语数据和判别式训练
本文研究语言建模在代表代码切换语言的语境下在自动语音识别(ASR)中所存在的难题,针对三个难点分别提出解决方案:如何从缺乏大规模训练数据、ASR 系统中与语言建模相关的性能测试的实现方法以及基于生成式模型所存在的缺陷,我们构建了一个独立于
→
PDF
6 years ago
将乘法特征整合入用于词汇语义蕴含的监督式分布式方法中
通过整合乘性特征来提高受监督的分布式方法在词汇暗示方面的性能,我们提供了不同分类器和评估设置的广泛评估,并建议适合的评估设置,消除了先前存在的偏见。
PDF
6 years ago
Prev
Next