BriefGPT.xyz
Ask
alpha
关键词
unstructured texts
搜索结果 - 4
语言模型在半结构化和非结构化对话数据集中的主题分割
我们综合分析了现有的最先进主题分割模型在非结构化文本上的泛化能力,并发现充分训练目标非结构化领域的相对较小规模数据集可以显著提高分割结果。在对非结构化和半结构化聊天进行分割时,我们的实证评估表明,Focal Loss 函数是交叉熵和加权交叉
→
PDF
8 months ago
野外话题分割:面向半结构化和非结构化聊天分割
本文在分析当前 NLP 中的主题分割模型的通用性能力时,发现在处理非结构化文本时,预训练策略并没有提高模型在该领域的可迁移性,只用一个相对较小的与目标结构相同的训练集从头开始训练模型,可以显著改善分类结果...
PDF
2 years ago
ACL
利用信息最大化的分层条件 VAEs 从上下文中生成多样且一致的问答对
本研究提出了一种基于信息最大化的分层条件变分自编码器用于生成问题回答对,使用自动生成的 QA 对针对基准数据集得出了比其他基线模型更好的性能表现,并使用少量数据获得了相当不错的半监督学习表现。
PDF
4 years ago
MM
应用自然语言处理技术进行民间故事的信息检索
利用自然语言处理和推理技术在领域本体上提取有关文学人物的信息。以民间故事为例构建了本体。
PDF
9 years ago
Prev
Next