Nov, 2022

TEMPERA: 通过强化学习进行测试时间提示

TL;DR本研究提出一种新的 Test-time Prompt Editing 方法,可以更好地适应不同查询和提供每个查询的可解释提示,相较于 Prompt tuning、AutoPrompt 和 RLPrompt,该方法可以在情感分析、主题分类、自然语言推理和阅读理解等多个任务中实现显著的改进。