BriefGPT.xyz
Ask
alpha
关键词
self-play technique
搜索结果 - 2
通过自我对话增强基于 LLM 的任务导向对话系统
通过使用大型语言模型进行自我对话的方法可以改进对话质量并生成用于训练的自我对话数据集。
PDF
6 months ago
TALM: 工具增强型语言模型
本文介绍了一种基于迭代 “自我对弈” 技术的文本增强语言模型方法,使用不可微分的工具扩充语言模型功能,成功在知识丰富型问答和简单工具所需的数学任务中具有很强的表现力,优于非增强型语言模型,在 QA 和数学任务的超越分布推理方面更是取得了成功
→
PDF
2 years ago
Prev
Next