利用大型语言模型进行移动应用评论特征提取
本研究评估了一个新提出的神经模型在提取评论方面的可行性,结果表明该模型能够从用户评论中准确识别和提取各个方面并生成用户偏好的基于方面的概要。
Apr, 2018
本研究提出了一种名为 AARSynth 的系统来解决自动生成精确应用程序响应的问题。通过将 seq2seq 模型与机器阅读理解模型相结合,利用对给定 app 的特定信息,自动检索并合成最终的响应。结果表明,AARSynth 在 BLEU-4 分数上比现有最先进的系统提高了 22.2% 的准确率,并通过人类研究证明了其比最先进的系统具有显著的响应质量改进。
Jul, 2020
本研究通过评估预训练语言模型用于生成移动应用程序用户反馈的回复,发现预训练模型可以生成更相关、有意义的回复,且对提供的训练数据的数量更具有鲁棒性。
Feb, 2022
该研究提出了一种新颖的框架,利用自然语言处理技术来理解移动应用程序的用户反馈,从而帮助软件公司根据用户评论来推动其技术价值流,发现需要改进的地方。该框架经过深入分析,其模块的效果得到了评估,并通过对长时间内十六个流行的 Android 应用商店应用的评论进行分析证明了其有效性。
Mar, 2023
本文介绍了一种基于云的系统,使用机器学习方法集成到管道中,能够从客户评论中提取洞察力,其复合模型使用基于transformer的神经网络、基于向量嵌入的关键字提取和聚类,可以更好地满足高效信息提取、提取信息的主题建模和用户需求的要求,并且比现有的主题建模和关键字提取解决方案取得更好的结果。该方法使用公开可用的数据集进行基准测试,并与其他最先进的方法进行验证和比较。
Jun, 2023
该论文对文档级情感分析模型进行了广泛比较评估,在关注模型部署可行性和资源消耗的重要指标方面,考虑了不同的特征提取技术、集成效果、任务特定的深度学习建模和领域无关的大型语言模型(LLMs)。研究发现,尽管微调的LLM获得了最高的准确率,但某些替代配置在资源消耗方面提供了巨大的节省,而准确率只有微小的损失。此外,研究还发现,在较小的数据集上,准确率的差异越来越小,而资源消耗的差异却越来越大。
Aug, 2023
提出了一种基于大型语言模型(LLMs)的工具Mini-BAR,用于进行英语和法语用户评论的零-shot挖掘,对应需求工程领域的双语应用程序评论分析。
Nov, 2023
通过机器学习和深度学习算法,使用情感分析明确揭示和解释应用市场评论的情绪,该研究通过探索性分析对应用程序评论进行情感分类,并确定大学生对应用市场的行为。
Dec, 2023
本研究解决了自动化分析用户对于应用程序功能情感的需求,填补了大型语言模型对特定功能情感分析探索的空白。通过比较GPT-4等先进模型在无示例、少量示例条件下的表现,结果发现GPT-4在特征提取的F1分数上比基于规则的方法提高了23.6%。本研究表明,大型语言模型在生成用户评论的功能特定情感摘要方面具有潜力。
Sep, 2024
本研究解决了用户评论中对应用功能情感分析的需求缺口,提出了一种自动生成功能级情感摘要的方法。通过比较多种先进的大语言模型(如GPT-4),发现GPT-4在0-shot特征提取中比基于规则的方法提高了23.6%的f1分数,并在5-shot情况下进一步提升。这表明大语言模型在生成用户评论的功能特定情感摘要方面具有良好的前景。
Sep, 2024