- 联合国大会辩论挖掘
该研究旨在利用自然语言处理技术分析联合国大会演讲,提取语义模式、情感分析和主题建模,为政治学家提供全面的数据集和工具,以便他们从中获取国际关系的见解并对全球外交话语有一个细致的理解。
- 利用大型语言模型和新的法律分类体系对案例法进行主题建模:人工智能对判决摘要的洞察
通过开发和应用新的法律分析分类法,本文对英国的判决摘要案例进行主题建模。研究发现法律大数据模型在正确分类主题上的准确率为 87.10%。该分析揭示了在不同法律领域中适用判决摘要的独特模式,为英国法律提供了一种新的分类法。这项工作的意义在于为 - 通过主题模型和超参数优化导航循环经济中的公众情绪
通过主题建模和超参数优化的探索,本研究开拓性地调查了关于循环经济的各个层次的公众观点。
- 利用潜在狄利克雷分配进行金融新闻中有关信息、预测和预测的自动检测
通过组合多段主题分割和共指消解分离作者表达模式、使用 LDA 检测相关文本以及分析其中的预测和预言的话语暂时性,我们提出了一个新颖的自然语言处理系统,以在非结构化文本来源中帮助投资者检测相关的金融事件。
- COLING大型语言模型为传统主题建模方法提供了一种替代方案
本研究旨在探讨大型语言模型(LLMs)在主题提取方面的潜力,并建立评估协议以评估 LLMs 的聚类效果。通过深入实验与评估,总结了采用 LLMs 进行主题提取的优势和限制。
- 基于 Transformer 表示的概率主题建模
我们提出了 Transformer-Representation Neural Topic Model (TNTM),它将基于变压器的嵌入空间中的主题表示优势与概率建模相结合,利用变分自编码器 (VAE) 框架提高推理速度和建模灵活性,实验 - 银行领域的主题建模方法比较
该研究使用了 KernelPCA 和 K-means Clustering 结合 BERTopic 架构,比较了主题建模方法,并在尼日利亚银行客户的推文数据集上展示了一致性得分为 0.8463 的连贯主题。
- 运用主题建模与引用网络分析研究欧洲人权法院关于尊重个人和家庭生活权的判例法
本研究旨在通过主题建模和引文网络的方法,使用欧洲人权公约第 8 条关于私人和家庭生活、住所和通信的欧洲人权法院案例,找到和组织相关案例,并证明该结合方法在提取和分析特定问题上的相关案例方面提供了最佳结果。
- 主题建模:超越标记输出
该研究介绍了一种将传统主题建模方法的输出扩展到除了独立的令牌列表之外的新方法,通过提取高评分的关键词,并将其映射到主题模型的令牌输出,提高其可解释性。
- 推特数据对未来的启示
通过研究推特上的未来学家预测的除了未来,并深入探究了语言提示对社交媒体用户的预测思维的影响,本研究使用尖端的自然语言处理模型构建了一个可扩展的 NLP 流程,并通过 LDA 和 BERTopic 方法识别了推特上未来学家的 15 个主题和 - 情感与加密货币价格之间的因果关系
本研究通过结合短文本主题建模和情感分析的技术来探讨 Twitter 等微博平台传达的叙述与加密资产价值之间的关系,揭示了涉及财务投资、技术进步、金融政策管制、媒体报道等 4-5 个与加密货币有关的叙述,并发现了其中部分叙述与加密货币价格之间 - 从新闻构建和解释因果知识图谱
本文提出了一种从新闻中构建因果知识图谱的方法,其中采用了基于 BERT 的抽取模型和主题模型等技术,最终实现了高召回率、高精度和高连通性的知识图谱,有效地捕捉和传达因果关系。
- 客户笔记数据的自然语言处理
本研究应用自然语言处理技术,对 B2B 数据集进行情感分析、主题建模和关键词提取,证明通过自动化方法能够准确地提取情感,并将笔记按相关性分类到不同主题。同时,本研究强调缺乏明确分离主题会导致主题缺乏与商业背景相关性。
- ACL一种以用户为中心,交互式,人机交互主题建模系统
开发了一种新型交互式人机协同的主题建模系统,支持对语料库特定方面的主题建模,具有易于使用的界面、记录与比较功能以及主题词推荐功能,经过多次用户研究验证,该系统在主题建模中的应用具有显著价值。
- 透过 Twitter 进行 COVID-19 主题建模的深度学习:Alpha、Delta 和 Omicron
本研究使用深度学习模型,利用印度 Twitter 数据集,对 COVID-19 疫情的第一至第三波进行话题建模,发现官方治理、疫苗接种和疫情管理等是话题重叠的主题,并发现 COVID-19 疫情的政治、社会和经济情况下出现了新问题。研究结果 - 连接人文社科:应用语言与语音技术于在线问卷调查
本文研究如何运用语音和语言技术处理荷兰面板调查中的开放性问题,使用自动语音识别处理口头回答并使用 transformer 模型进行情感分析和主题模型分析。
- 金融新闻文章中新兴趋势的情境化研究
通过对 Microsoft 金融新闻的研究,探讨了 2019 年 7 月至 2020 年 7 月期间 COVID-19 疫情前后的新趋势检测,以主题建模和词频为基础探索关键字之间的相似性动态,并与 Google Trends 进行了评估,最 - 采用自然语言处理方法进行教育反馈分析的趋势和挑战综述
本文概述了人工智能在教育领域的应用,针对学生反馈数据,提出了利用自然语言处理技术来识别教育基础设施、学习管理系统、教学实践和学习环境的改进方向,并重点介绍了情感标注、实体注释、文本摘要和主题建模等文本分析技术在教育领域的应用及其存在的挑战。
- 使用潜在狄利克雷分配方法进行的关于冠状病毒的瑞典报纸文章主题建模: 以案例研究为基础
该研究使用 Latent Dirichlet Allocation (LDA) 方法建模了瑞典报纸文章关于冠状病毒的主题变化,旨在支持社会经济影响研究以及临床和医疗保健分析等领域的话题建模应用。
- 揭秘推特上的 COVID-19 疫苗话语
通过自然语言处理技术训练立场检测算法,通过主题建模技术检查疫苗接种的公共言论,发现双重立场使用者发布的推文占主要地位,正反两面的推文共同讨论了许多不同的问题,以真实问题为主的反疫苗推文与虚假信息相关的含义占大多数,表情和笑话占据了最多的转发