关键词topic-specific datasets
搜索结果 - 2
- SPICED: 具有多个主题和复杂级别的新闻相似性检测数据集
利用智能系统检测新闻文章中冗余信息的使用越来越普遍,而新闻媒体的激增为此提供了机会。然而,新闻的异质性可能导致这些系统产生虚假的发现。将新闻相似性数据集按主题分割能提高这些模型的训练效果,但目前缺乏主题特定的数据集。本文提出了一个新的相似新 - 学习关于日常事件之间的环境关系的细粒度知识
通过普通人提供的社交媒体用户生成内容,我们开发并测试了一种新颖的方法,从中学习关于日常事件之间的因果和条件关系的细粒度常识知识,该方法对于文本和故事理解、信息提取、问题回答和文本摘要具有重要意义,并且我们的实验证明,使用特定主题数据集可以学