Apr, 2022

什么使得指导学习变得困难?一个人工环境的研究和新挑战

TL;DR使用 T5-based text2text transformer 构建了一个 Hard RegSet dataset,用于研究 instruction learning,该 transformer 学习从指示中执行任务的能力存在挑战,其中大型正则表达式和需要跟踪更长的先前步骤的执行更加困难。