embedding-based metrics | BriefGPT

关键词embedding-based metrics

搜索结果 - 4

关于基于嵌入的方法在代码生成中测量功能正确性的局限性
使用嵌入式度量指标如 CodeBERTScore 来测量功能正确性和编辑工作量的能力分析。
PDF2 months ago
AfriMTE 和 AfriCOMET：推动 COMET 接纳资源匮乏的非洲语言
通过创建人工评估数据和简化的 MQM 指南，以及利用高资源语言的 DA 训练数据和 AfroXLM-Roberta 多语言编码器，我们解决了多语言机器翻译在非洲语言方面的挑战，并创建了最先进的评估指标 AfriCOMET，得到了与人工判断的
PDF8 months ago
PONE：一种新型开放域生成对话系统自动评估度量
通过对三类自动评估方法的系统比较，本文认为基于学习的指标是评估开放领域生成对话系统最有效的方法。为了解决由于负采样机制导致的数据集不平衡和低质问题，本文提出了一种新的基于学习的评估指标 PONE，并经过实验证明，在使用增强的正样本和有价值的
PDF4 years ago
从灾难相关的推文中提取关键词
本文探讨如何从社交媒体平台（如 Twitter）中提取与灾难有关的关键词，以帮助加强对灾害现场情况的认识。作者提出了一种基于嵌入式度量的模型来评估关键词提取的质量，这一模型比 F1 得分更准确。作者改进了嵌入式度量模型，并通过使用上下文词嵌
PDF5 years ago