BriefGPT.xyz
Ask
alpha
关键词
auto-evaluation
搜索结果 - 3
大型语言模型自动评估归因
本文探讨了大型语言模型在自动评估引用时的两种方法:引导 LLM 和微调更小的 LM。我们手动策划了一组测试样例以涵盖 12 个领域并评估了其自动评估的结果,旨在为这一重要问题的未来研究打下基础。
PDF
a year ago
基于置信度类别关系感知回归的自动评估
本文提出了一种基于置信度和类别关系感知的回归方法,称为 $C^2R^2$,通过利用局部和全局表现建立分类模型和测试数据之间的关联,以实现对已训练模型进行自动评估。
PDF
a year ago
EMNLP
现实世界文本风格转移自动评估的艰巨任务
本文讨论了文本风格迁移技术中的关键问题,即使用无监督生成方法,自动评估风格迁移任务的难点。通过对类似文献的总结,我们阐述了当前风格迁移研究的问题,并指出现有的自动评估方法存在缺陷,无法准确评估迁移后句子的风格准确性、内容相似度和流畅性。本文
→
PDF
5 years ago
Prev
Next