Sep, 2023

基于 GPT 的文本规范化研究

TL;DR通过自洽性推理和语言学提示工程,我们发现基于大型语言模型(LLM)的文本规范化能够实现比顶级规范化系统低约 40%的错误率,并据此发现了传统文本规范化任务设计中的关键限制。我们创建了一个新的文本规范化错误分类系统,并应用于 GPT-3.5-Turbo 和 GPT-4.0 的结果,从而可以识别出基于 GPT 的 TN 的优势和劣势,为未来的研究提供了机会。