Sep, 2023

探索嵌入技术以衡量文本相关性:揭示在线评论中的情感和关系

TL;DR由于一次导致互联网使用增长 70% 的大流行病,全球范围内使用社交媒体的人数大幅增加。本研究通过使用词嵌入来分析评论中的组成部分和文档,调查了不同社交媒体平台上的情感和语义关系,论述了共享意见在这些不同媒体平台之间的重要性,为研究人员、政治家和商业代表提供跟踪全球用户共享情绪的路径。本研究呈现了多种测量从这些热门在线平台上提取的文本相关性的方法,通过利用捕捉语义关系的词嵌入来分析网络上的情感,我们可以揭示公众舆论作为一个整体的联系。该研究利用了来自 YouTube、Reddit、Twitter 等的现有数据集,并利用了像双向编码器表征来自变形器(BERT)等热门自然语言处理模型来分析情感和探索评论嵌入之间的关系。此外,我们还将利用聚类和 Kl 散度来发现不同社交媒体平台上这些评论嵌入之间的语义关系。我们的分析将使人们更加深入地了解在线评论之间的相互关联,并探讨互联网作为一个庞大的相互连接的大脑的概念。