利用大型语言模型进行移动应用评论特征提取

Aug, 2024

利用大型语言模型进行移动应用评论特征提取

Leveraging Large Language Models for Mobile App Review Feature Extraction

Quim Motger, Alessio Miaschi, Felice Dell'Orletta, Xavier Franch, Jordi Marco

TL;DR本研究解决了移动应用评论分析中提取特征的难题，尤其是面对低质量、主观偏见和噪声内容的挑战。研究提出了一种新的监督令牌分类方法，通过延长预训练模型和实例选择技术来提高特征提取的准确性和效率，从而为移动应用评论的自然语言处理提供实用方法和实证证据。

Abstract

Mobile app review analysis presents unique challenges due to the low quality, subjective bias, and noisy content of user-generated documents. Extracting features from these reviews is essential for tasks such as feature prioritization and sentiment analysis, but it remains a challenging task. Meanwhile, encoder-only models based on the Transformer architectu

发现论文，激发创造

使用方面抽取方法生成评论摘要和用户配置文件

本研究评估了一个新提出的神经模型在提取评论方面的可行性，结果表明该模型能够从用户评论中准确识别和提取各个方面并生成用户偏好的基于方面的概要。

Apr, 2018

用户评价的应用感知响应合成

本研究提出了一种名为 AARSynth 的系统来解决自动生成精确应用程序响应的问题。通过将 seq2seq 模型与机器阅读理解模型相结合，利用对给定 app 的特定信息，自动检索并合成最终的响应。结果表明，AARSynth 在 BLEU-4 分数上比现有最先进的系统提高了 22.2% 的准确率，并通过人类研究证明了其比最先进的系统具有显著的响应质量改进。

Jul, 2020

预训练的神经语言模型用于自动生成移动应用用户反馈答案

本研究通过评估预训练语言模型用于生成移动应用程序用户反馈的回复，发现预训练模型可以生成更相关、有意义的回复，且对提供的训练数据的数量更具有鲁棒性。

Feb, 2022

分析应用评论以推动技术价值流》论文的附录

该研究提出了一种新颖的框架，利用自然语言处理技术来理解移动应用程序的用户反馈，从而帮助软件公司根据用户评论来推动其技术价值流，发现需要改进的地方。该框架经过深入分析，其模块的效果得到了评估，并通过对长时间内十六个流行的 Android 应用商店应用的评论进行分析证明了其有效性。

Mar, 2023

一种基于云端的机器学习流水线，用于高效地从客户评论中提取洞察信息

本文介绍了一种基于云的系统，使用机器学习方法集成到管道中，能够从客户评论中提取洞察力，其复合模型使用基于transformer的神经网络、基于向量嵌入的关键字提取和聚类，可以更好地满足高效信息提取、提取信息的主题建模和用户需求的要求，并且比现有的主题建模和关键字提取解决方案取得更好的结果。该方法使用公开可用的数据集进行基准测试，并与其他最先进的方法进行验证和比较。

Jun, 2023

高效情感分析: 特征提取技术、集成以及深度学习模型的资源感知评估

该论文对文档级情感分析模型进行了广泛比较评估，在关注模型部署可行性和资源消耗的重要指标方面，考虑了不同的特征提取技术、集成效果、任务特定的深度学习建模和领域无关的大型语言模型（LLMs）。研究发现，尽管微调的LLM获得了最高的准确率，但某些替代配置在资源消耗方面提供了巨大的节省，而准确率只有微小的损失。此外，研究还发现，在较小的数据集上，准确率的差异越来越小，而资源消耗的差异却越来越大。

Aug, 2023

大型语言模型的零翻译双语应用评论挖掘

提出了一种基于大型语言模型（LLMs）的工具Mini-BAR，用于进行英语和法语用户评论的零-shot挖掘，对应需求工程领域的双语应用程序评论分析。

Nov, 2023

从Google应用程序评论中察觉大学生的意见

通过机器学习和深度学习算法，使用情感分析明确揭示和解释应用市场评论的情绪，该研究通过探索性分析对应用程序评论进行情感分类，并确定大学生对应用市场的行为。

Dec, 2023

使用大型语言模型进行应用程序评论的细粒度情感分析：评估研究

本研究解决了自动化分析用户对于应用程序功能情感的需求，填补了大型语言模型对特定功能情感分析探索的空白。通过比较GPT-4等先进模型在无示例、少量示例条件下的表现，结果发现GPT-4在特征提取的F1分数上比基于规则的方法提高了23.6%。本研究表明，大型语言模型在生成用户评论的功能特定情感摘要方面具有潜力。

Sep, 2024

基于大语言模型的应用评论细粒度情感分析：评估研究

本研究解决了用户评论中对应用功能情感分析的需求缺口，提出了一种自动生成功能级情感摘要的方法。通过比较多种先进的大语言模型（如GPT-4），发现GPT-4在0-shot特征提取中比基于规则的方法提高了23.6%的f1分数，并在5-shot情况下进一步提升。这表明大语言模型在生成用户评论的功能特定情感摘要方面具有良好的前景。

Sep, 2024