社交媒体可定位实体识别
我们开发了一种适用于社交媒体的具有命名实体识别功能的仇恨言论检测工具,该工具能准确识别攻击性言论并标记相关群体。在社交媒体的案例研究中证明了工具的实用性,并对不同类型的攻击进行了对比和分析。
May, 2024
本文提出了一种名词实体识别系统,旨在识别播客音频中的电影标题。我们实施了一个两阶段的方法,结合模糊匹配和对电影特定元数据敏感的线性模型,来解决计算机转录错误的问题,并且不需要显著的计算开销。在多样化的播客集上进行评估,当结合模糊匹配和线性模型时,在三个基准方法上 F1 分数增加了 20% 以上。
Sep, 2018
提出了一种新的多任务方法,通过使用 NE 分段及精细 NE 分类的主要任务和更一般的辅助任务,利用多任务神经网络构架来学习更高阶特征表示,以传统的 CRF 分类器和神经网络结合的方式来解决 Twitter 和分类不一致的问题。
Jun, 2019
本研究旨在探索利用预训练模型进行 Twitter 命名实体识别的问题,构建了一个包含七个实体类型的数据集 TweetNER7,并提供了一组语言模型基线。通过分析不同时期对语言模型性能的影响,尤其是短期降级、基于不同时间段进行语言模型微调的策略和自我标记作为最近标记数据的替代方案。
Oct, 2022
本文讨论了对于不规则、嘈杂、依赖上下文及动态性的推文(一种微博形式),运用自然语言处理技术进行挖掘和智能信息访问的挑战,重点关注了从推文中提取实体并进行实体消歧的任务,介绍了一个新的 Twitter 实体消歧数据集,并对多个最先进的 Named Entity Recognition & Disambiguation 模型进行了实证分析。
Oct, 2014
本文研究了基于社交媒体文本的命名实体识别,旨在提高土耳其推特上的识别效果,通过放宽语言规则和扩展词汇资源,以及使用简单的标准化方案,得到了实验结果和讨论。
Oct, 2014
本文基于神经网络的半监督学习方法,利用非监督学习获取的词向量及专门为微博文本设计的语言无关特征,成功生成一种识别土耳其微博文本中命名实体的系统,并在推特信息上表现出较好的 F-score 性能,相比之前提出的 NER 系统有所提升。该方法没有使用任何特定的语言特征,因此可以轻松地适用于其他形态丰富的语言的微博文本。
Oct, 2018
本研究介绍了一项新任务:Dynamic Named Entity Recognition(DNER),提供了一个框架,以更好地利用上下文来评估算法提取实体的能力。DNER 基于两个数据集,DNER-RotoWire 和 DNER-IMDb,我们评估了基线模型并提出了与此新任务相关的问题和研究方向的实验。
Feb, 2023
这项人类主题研究的目标是学习如何在有挑战性的情况下,引导设计更好的评估方法和 NER 算法,比较 NER 在有许多不规则和新颖的命名实体的对话音乐推荐查询语料库上的人类和算法表现,并分析了不同类型实体的错误模式。
Mar, 2023