BriefGPT.xyz
大模型
Ask
alpha
关键词
evaluation challenges
搜索结果 - 4
深度聚类评估:如何验证内部聚类验证指标
利用深度神经网络对复杂、高维数据进行分区的深度聚类方法存在独特的评估挑战,传统的聚类验证度量方法因适用于低维空间而在深度聚类中存在问题,本文针对在深度学习中评估聚类质量的问题进行了研究,提出了一个理论框架来突出使用内部验证度量方法在原始数据
→
PDF
3 months ago
自动化数据集更新以实现可靠和及时评估
通过自动化数据集更新以可靠且及时进行评估,来解决大型语言模型面临的评估挑战及数据泄漏问题。
PDF
4 months ago
事件提取的再评估:过去、现在和未来的挑战
本文讨论和解决事件提取评估中的挑战,并提出了 TextEE 作为一个标准化、公平和可重现的事件提取基准,包含了多个领域的标准化数据预处理脚本和数据集切分,重新评估了多个事件提取方法,并探索了大型语言模型在事件提取中的能力和未来挑战。
PDF
8 months ago
ACL
长格式问答进展的障碍
该论文探讨了长篇问答任务中关于评估和数据集构建所面临的挑战,在提出新模型的同时指出该任务中 ROUGE-L 评估不具信息性,且训练集和验证集存在显著重复。给出了缓解这些问题的建议。
PDF
3 years ago
Prev
Next