Jul, 2022

Thutmose 标注器:用于反向文本规范化的单通神经模型

TL;DR本文提出了一种基于单通词分类器模型的逆文本规范化方法,该方法通过在每个输入标记上分配替换片段或标记它们以进行复制或删除来执行此任务,并通过基于 ITN 实例的颗粒对齐的数据集准备方法来缓解网络模型的幻觉问题。此方法在英语和俄语测试集上均取得了最新的句子准确率。