EMNLPSep, 2021

子词切分对非拼接形态转换的适用性如何?

TL;DR本论文研究基于数据驱动的子词分割在自然语言处理等领域的应用是否适用于非连接语素构词方式,通过一套测试套件对分割策略在不同形态学现象上的表现进行比较,并发现学习分析和生成表面的形态上下文仍然具有挑战性且应针对多种语言应用测试新的文本表征策略,以减少不同策略对某些语言造成的不利影响。