EMNLPDec, 2023

可扩展的、数据驱动的理论: NLP 科学进展的范式

TL;DR我提出了一种以发展可扩展的、数据驱动的语言结构理论为核心的 NLP 科学进展的理念,该理念在于以严格限定的方式收集数据,并通过机器学习构建解释性理论,以构建可理解的 AI 系统的基础。本文介绍了使用基于问题 - 答案的语义角色标注 (QA-SRL) 对浅层语义结构进行数据驱动理论研究的几个调查,以及收集数据和理论建模的原则,这些原则能够指导未来的科学进展。