evaluation setups | BriefGPT

关键词evaluation setups

搜索结果 - 5

ACL基于 Transformer 模型的多词表达语义研究：一项调查
通过对多词表达式的深入调查，我们发现 Transformer 模型在捕捉多词表达式的语义上存在不一致性，主要依赖表面模式和记忆信息，并且其表示在架构的早期层中主要存在。另外，我们强调了更直接可比较的评估设置的需求。
PDF5 months ago
通向通用多模型的视觉指导调整：一项调查
本文系统综述了视觉指令调整方法，包括计算机视觉任务范式、视觉指令调整的发展、常用的网络架构、评估设置和任务、常用的数据集、已有的视觉指令调整方法的分类和对比、挑战和未来研究方向。
PDF6 months ago
预训练模型中非受控的词汇暴露导致组合泛化被高估
通过对 Kim and Linzen（2020）的 COGS 基准进行测试，我们发现两种修改后的评估设置均导致 T5（Raffel et al.，2020）的泛化性能降低，暗示以前报道的结果由于预训练期间未受控制的词汇暴露而被高估。
PDF2 years ago
强化学习在交易系统中的应用：调查
本研究基于强化学习技术的理论基础和概念，对 29 篇相关研究进行了综合分析和比较，总结出了当前的系统设计最佳实践、需要进一步研究的领域和有前途的研究机会。此外，本文还试图通过帮助研究人员遵守标准和避免偏离强化学习构造的坚实基础来促进该领域的
PDF2 years ago
ICML重访 Hotels-50K 和 Hotel-ID
本文提出了针对酒店识别领域中的 Hotels50K 和 Hotel-ID 两个数据集的更新版本，以提供不同难度等级的评估设置，以更好地适应于拟定的真实应用领域，从而在对抗人口贩卖中起到作用。通过多种最先进的图像检索模型对此设置进行测试，结果
PDF2 years ago