BriefGPT.xyz
Ask
alpha
关键词
automatic evaluations
搜索结果 - 3
FreeEval: 大型语言模型的可靠高效评估的模块化框架
介绍了一个名为 FreeEval 的模块化和可扩展框架,用于可靠高效地自动评估大型语言模型,通过统一的架构整合了各种评估方法,并结合人工评估和数据污染检测等元评估技术,实现了评估结果的公平性。
PDF
3 months ago
COLING
RankPrompt: 逐步对比使语言模型成为更好的推理者
通过使用 RankPrompt 方法,LLMs 可以自我评级其回答,从而显著提高 ChatGPT 和 GPT-4 的推理表现。
PDF
4 months ago
EMNLP
将无监督风格转移重新制定为近义词生成
该论文提出了一种简单的基于预训练语言模型的方法,将非监督风格转移重新规定为句子释义生成问题,本文在人工和自动评估方面显著优于目前最先进的风格转移系统,并发现现有的自动指标可以进行简单地误导,最后通过收集具有 11 种不同风格的大型数据集进一
→
PDF
4 years ago
Prev
Next