BriefGPT.xyz
大模型
Ask
alpha
关键词
benchmarking generative models
搜索结果 - 2
提取 - 生成轴:衡量生成式语言模型中内容 “借用
生成性语言模型的特性,对内容授权和归属产生了影响,因此我们提出提取 - 摘要轴用于评估生成模型,并强调开发相应的度量标准、数据集和注释指南的需求。我们限制讨论于文本模态。
PDF
a year ago
评估大型语言模型在生成准确教师回应方面的有效性
通过评估多个基准生成模型在教育对话中提供信息和帮助学生的能力,本研究旨在模拟一个有知识的老师的角色,并发现 GPT-4 在教师 - 学生聊天记录子集上的优越性,测量标准是 BERTScore 和 DialogRPT,同时注意到采样、代表性和
→
PDF
a year ago
Prev
Next