Apr, 2023

HeySQuAD:一个口语化问答数据集

TL;DR本研究主要介绍了一个新的基于 HeySQuAD 数据集的 SQA 系统基准测试方法,该方法使用了包含 76k 个人类口述问题和 97k 个机器生成问题的问答数据集,证明了使用转录的口述问题进行训练可以显著提高系统的性能 (12.51%),具有很高的实践价值。