关键词automated metrics
搜索结果 - 30
- ACLFavi-Score: 自动生成人工智能评估中的偏袒度量PDFa month ago
- 通过多阶段端到端方法增强 LLMs 的演示文稿生成PDFa month ago
- 推动文本到图像模型评估中的地理包容性PDF2 months ago
- 基于似然的大型语言模型评估偏差的缓解PDF4 months ago
- ChatGPT 是否能与神经机器翻译匹敌?一项比较研究PDF6 months ago
- ACL多项选择测试中的干扰项评估PDF8 months ago
- Chainpoll:一种高效的 LLM 幻觉检测方法PDF8 months ago
- 哪种提示更具差异性?用于高效人工 LLM 评估的数据排序PDF8 months ago
- 利用大型语言模型进行文本风格转换评估PDF10 months ago
- 什么是好的改写:自动评估是否有效?PDFa year ago
- 从文本中合成艺术电影化图像PDFa year ago
- 自动度量文本生成偏好评级中的错误校正PDFa year ago
- ACL模型分析与评估:歧义问题回答PDFa year ago
- 基于点互信息度量和解码策略的文本对话生成中忠实度实现PDFa year ago
- 通过盲评审和文本分类算法比较 ChatGPT 生成的抽象概括和真实概括PDFa year ago
- ACL质量估计之穷人版:在没有参考文本的情况下预测基于参考文本的机器翻译度量PDFa year ago
- 针对条件自然语言生成的分布感知度量PDF2 years ago
- ACL利用常识和数据增强的目标导向对话响应生成PDF2 years ago
- Minecraft 自动视域计算PDF2 years ago
- ACL基于神经度量的最小贝叶斯风险解码:高质量而非高模型概率PDF3 years ago
Prev