BriefGPT.xyz
大模型
Ask
alpha
关键词
proper nouns
搜索结果 - 4
来自其他语言的专有名词音译的聚类
通过使用机器学习技术和数学相似度方程,我们提出了一种针对专有名词的拼写变异进行聚类的方法,可以显著减少人工标注的工作量,从而降低了数据清洗和格式化的需求。
PDF
9 months ago
跨领域评估词性标注器:从华尔街日报到 Fandom Wiki
根据 Elder Scrolls Fandom 的数据,分别采用 Stanford 标注器和 Bilty 标注器进行研究,发现在培训过的记号上性能几乎与域内性能一样好,但是对于未知标记的准确性会降低,同时两个标注器都在专有名词和不一致的大小
→
PDF
a year ago
EMNLP
评估迷雾:双语词典归纳的误导性基准
研究跨语言词嵌入的双语词典归纳的任务,发现现有数据集存在的困扰性问题:(1)数据中有 1/4 的专有名词,难以反映 BDI 表现,(2)黄金标准数据存在普遍间隔,对个体语言之间交叉嵌入系统排名和性能差异的总体度的影响,提出未来的研究要么避免
→
PDF
5 years ago
新闻标题中的假消息:使用简单、重复内容的正文,更接近于讽刺而非真实新闻
该研究探讨了虚假新闻的问题,并通过研究文章的语言、风格和标题结构等特征,发现虚假新闻更像是讽刺类的文章,它们通过启发式的方法而不是强力的论点来达到制造心理联想的目的。标题结构和标题中专有名词的使用是区分真假新闻的重要特征。
PDF
7 years ago
Prev
Next