Nov, 2022
野外话题分割:面向半结构化和非结构化聊天分割
Topic Segmentation in the Wild: Towards Segmentation of Semi-structured & Unstructured Chats
Reshmi Ghosh, Harjeet Singh Kajal, Sharanya Kamath, Dhuri Shrivastava, Samyadeep Basu...
TL;DR本文在分析当前 NLP 中的主题分割模型的通用性能力时,发现在处理非结构化文本时,预训练策略并没有提高模型在该领域的可迁移性,只用一个相对较小的与目标结构相同的训练集从头开始训练模型,可以显著改善分类结果...