社交世界知识:建模与应用
本研究探讨在线社交网络与开放知识库之间的联系,提出一种基于多模态贝叶斯嵌入模型的算法 GenVector,通过学习潜在话题和生成单词和网络嵌入来将两种不同的数据形式,在共享潜在话题空间中表示。在三个数据集上的实验表明,该算法明显优于现有方法,并在 AMiner 上部署,显著降低了在线 A/B 测试中的错误率。
Aug, 2015
本文试图通过利用微博中的社交网络结构,将作者、提及和实体编码成一个连续向量空间,并将这些向量纳入神经结构预测模型中,以捕捉实体链接任务中固有的结构约束。与现有的最新技术相比,这些设计决策在基准数据集上的 F1 值提高了 1%-5%。
Sep, 2016
该研究回顾了最近在社交媒体用户的表征学习领域的进展,并提供了从异构用户数据(例如,将社交媒体文本与图像相结合来学习统一用户表征)中学习统一用户嵌入的典型方法,该技术对于创建高性能的基于社交媒体的人类特征和行为模型至关重要。
Jun, 2019
本文介绍了基于 37,604 篇开放获取的社会科学研究论文构建和评估词向量模型。在评估中,我们比较了特定领域和通用语言模型在语言覆盖、多样性和语义关系方面的差异。我们发现,即使词汇表的大小相对较小,所创建的特定领域模型覆盖了社会科学概念的大部分,与更通用的模型相比,邻域更加多样化。在所有关系类型中,我们发现更广泛的语义关系覆盖范围。
Feb, 2023
研究机器学习模型,学习低维表示模式,将词嵌入技术应用于人类行为挖掘,探讨其优势和趋势,并警示相似性度量常常在单独层面返回一致结果,但在聚合层面则有可能产生不同结果。
Jul, 2022
本文提出了一种新颖而简单的技术,将来自不同结构的两个大型知识库中的概念知识(Wikipedia 和 Probase)整合起来,学习概念表示,并在两个任务上评估了概念嵌入模型:类比推理和概念分类,并展示了无监督环境中用于神经语义分析的参数识别的案例研究,相对于 gazetteer 和正则表达式等繁琐易出错的方法,我们的无监督方法具有更好的泛化能力。
Jan, 2018
本文提出了一种基于网络结构和社交演员属性相似性的社交网络嵌入框架,在节点分类和链接预测任务上均实现了显著的性能提升,比如在链接预测任务上相比 node2vec 提高了 8.2%。
May, 2017
该研究探讨了一种计算模型,即词嵌入模型,通过将词表示为多维空间中的向量,从词汇共现模式中学习来自语义记忆中的常见知识,并提出了语义投影的解决方案,以检验词嵌入模型是否能够恢复多种语义特征和对象属性的上下文依赖关系。
Feb, 2018
提出了一种用多个知识库来加强大型模型表示的方法,每个知识库都通过一个集成实体链接器来检索相关实体嵌入,然后通过单词与实体关注的形式更新上下文单词表示,经实验发现知识增强的 BERT 模型具有更好的性能,且运行时间与 BERT 相当。
Sep, 2019