关键词fine-grained feedback
搜索结果 - 6
- 纷扰的细粒度反馈:超越赞 / 踩 —— 面向文本到图像生成的挑战PDF8 days ago
- 基于策略的细粒度知识反馈用于幻觉缓解PDF14 days ago
- ACL通过细粒度自我反思实现强化学习(RLRF):对齐和改进 LLMsPDF3 months ago
- RCOT:通过逆向思路链来检测和纠正推理中的事实不一致性PDFa year ago
- 使用元探索为交互式学生程序提供反馈PDF2 years ago
- 基于负面反馈的对话式产品搜索PDF5 years ago
Prev
Next