BriefGPT.xyz
Ask
alpha
关键词
inference time optimization
搜索结果 - 1
精准指点,而非批评:通过精细的可操作反馈改进大型语言模型
使用细粒度的可行操作反馈,基于学习的错误定位模型预测的错误类型、错误位置和严重程度,提出了 FITO(一种推理时间优化方法)来进行迭代改进,通过一个生成改进输出的改进模型,迭代地结合反馈。我们在三个文本生成任务上进行了实验,包括机器翻译、长
→
PDF
8 months ago
Prev
Next