社交世界知识：建模与应用

Jun, 2023

Social World Knowledge: Modeling and Applications

Nir Lotan, Einat Minkov

TL;DR本文提出了一种从社交网络中提取实体向量的框架 ——SocialVec，并将其应用于衡量新闻来源的政治偏向和预测个人特质两项任务中，展示了比基线方法优越或有竞争力的表现。

Abstract

social world knowledge is a key ingredient in effective communication and information processing by humans and machines alike. As of today, there exist many knowledge bases that represent factual world knowledge.

social world knowledge knowledge bases socialvec twitter users entity embeddings

发现论文，激发创造

多模式贝叶斯嵌入：学习社交知识图谱

本研究探讨在线社交网络与开放知识库之间的联系，提出一种基于多模态贝叶斯嵌入模型的算法 GenVector，通过学习潜在话题和生成单词和网络嵌入来将两种不同的数据形式，在共享潜在话题空间中表示。在三个数据集上的实验表明，该算法明显优于现有方法，并在 AMiner 上部署，显著降低了在线 A/B 测试中的错误率。

Aug, 2015

走向社交化信息提取：嵌入作者、提及和实体

本文试图通过利用微博中的社交网络结构，将作者、提及和实体编码成一个连续向量空间，并将这些向量纳入神经结构预测模型中，以捕捉实体链接任务中固有的结构约束。与现有的最新技术相比，这些设计决策在基准数据集上的 F1 值提高了 1%-5%。

Sep, 2016

基于社交媒体的用户嵌入：文献综述

该研究回顾了最近在社交媒体用户的表征学习领域的进展，并提供了从异构用户数据（例如，将社交媒体文本与图像相结合来学习统一用户表征）中学习统一用户嵌入的典型方法，该技术对于创建高性能的基于社交媒体的人类特征和行为模型至关重要。

Jun, 2019

社会科学中词嵌入的评估

本文介绍了基于 37,604 篇开放获取的社会科学研究论文构建和评估词向量模型。在评估中，我们比较了特定领域和通用语言模型在语言覆盖、多样性和语义关系方面的差异。我们发现，即使词汇表的大小相对较小，所创建的特定领域模型覆盖了社会科学概念的大部分，与更通用的模型相比，邻域更加多样化。在所有关系类型中，我们发现更广泛的语义关系覆盖范围。

Feb, 2023

社会科学的词嵌入：跨学科调查

研究机器学习模型，学习低维表示模式，将词嵌入技术应用于人类行为挖掘，探讨其优势和趋势，并警示相似性度量常常在单独层面返回一致结果，但在聚合层面则有可能产生不同结果。

Jul, 2022

超越词嵌入：从大规模知识库中学习实体和概念表示

本文提出了一种新颖而简单的技术，将来自不同结构的两个大型知识库中的概念知识（Wikipedia 和 Probase）整合起来，学习概念表示，并在两个任务上评估了概念嵌入模型：类比推理和概念分类，并展示了无监督环境中用于神经语义分析的参数识别的案例研究，相对于 gazetteer 和正则表达式等繁琐易出错的方法，我们的无监督方法具有更好的泛化能力。

Jan, 2018

探索词语和关系的理论表示

该研究提出了一种理论方法，将词嵌入和知识图谱中的实体及其关系的几何形状联系起来，以便更好地理解它们的语义结构和性能。

Feb, 2022

属性社交网络嵌入

本文提出了一种基于网络结构和社交演员属性相似性的社交网络嵌入框架，在节点分类和链接预测任务上均实现了显著的性能提升，比如在链接预测任务上相比 node2vec 提高了 8.2%。

May, 2017

语义投影：从词嵌入中恢复多个不同物体特征的人类知识

该研究探讨了一种计算模型，即词嵌入模型，通过将词表示为多维空间中的向量，从词汇共现模式中学习来自语义记忆中的常见知识，并提出了语义投影的解决方案，以检验词嵌入模型是否能够恢复多种语义特征和对象属性的上下文依赖关系。

Feb, 2018

知识增强的上下文词表示

提出了一种用多个知识库来加强大型模型表示的方法，每个知识库都通过一个集成实体链接器来检索相关实体嵌入，然后通过单词与实体关注的形式更新上下文单词表示，经实验发现知识增强的 BERT 模型具有更好的性能，且运行时间与 BERT 相当。

Sep, 2019