Dec, 2022

文本到 SQL 解析中合成高质量数据的重要性

TL;DR本文提出了一种新颖的数据合成框架,其中包括来自模式的关键关系、强类型和基于模式距离的列抽样,并采用了 SQL-to-text 任务的中间表示(IR),进一步提高了生成的自然语言问题的质量。实验证明,当现有强大的语义解析器在高质量的合成数据上进行预调整时,这些模型在流行的基准测试中的准确性得到了显着提高。