May, 2025

检测俄语诗歌文本中的拼写和语法异常

TL;DR本研究解决了生成模型训练集中自然语言文本质量不足的问题,尤其是在诗歌创作中。我们提出了一种自动语言异常检测的方法,能够有效识别和过滤低质量文本,进而提升生成模型的输出质量。最重要的发现是,通过引入RUPOR数据集和比较多种异常检测方法,本研究为提高创意领域训练数据集的质量提供了有效工具和见解。