本文介绍了自动评论任务的提出和拥有数百万真实评论和人工标注的子集的大规模中文数据集,并开发了考虑评论质量与人类评估相关性的自动度量标准。
May, 2018
本文介绍了一个公开的科学领域数据集,提供了许多研究机会,该数据集集中在同行评审中使用的文本数据,此外,作者提出了两个基于 NLP 技术的新任务,包括简单的基准模型,第一个任务中,简单模型可以预测文章是否被接受,并且还可以在第二个任务中预测审稿方面的数值分数。
Apr, 2018
使用名为 ReAct 的方法,在大型语言模型中交错生成推理迹线和任务特定的操作,以促进两者之间的协作,从而在多项语言理解和决策任务中提高其有效性,同时优于缺乏推理或行为组件的方法。
Oct, 2022
利用基于方面的情感分析从科学评论中提取有用信息可以更好地判断接受 / 拒绝决策,并且发现审稿人之间的不一致程度可能与主席的意见不一致有关。
Jun, 2020
本研究旨在引入一个新的、需要逻辑推理的阅读理解数据集(ReClor),以推动对文本更全面的推理。实证研究结果表明,针对存在偏见的数据点并将其分为简单和困难集合,可对模型的逻辑推理能力进行全面的评估,从而在提高模型性能的同时,推动领域内更多的研究。
Feb, 2020
使用 CamemBERT 实现对健康和健身领域的三个应用程序的 6000 条用户评论的自动分析,创造了一个多标签分类数据集。结果鼓舞人心,表明可以自动识别关于新功能请求的评论。
Jun, 2022
本文介绍了以意见为主题的 ReCO 数据集,该数据集是目前中文阅读理解数据集中最大的,其中需要进行因果推理、逻辑推理等各种推理技能。与传统数据集不同的是,ReCO 除了提供上下文段落外,还提供支持证据,这为机器阅读理解提供了很好的挑战。
介绍了一个 230k 的社交媒体帖子数据集 CARE$_{db}$,通过 Common Affective Response(CARE)方法进行标注,旨在预测社交媒体帖子在用户中引起的情感反应,并使用该数据集训练基于 BERT 的模型预测情感反应以及情感检测。
Jan, 2022
本篇研究致力于利用基于 BERT 的分类器对商品评论中的方面和组成元素信息加以标记,并通过数据增强方法提高系统对于数据不足时的精度,结果表明该系统能够对如路单车等商品评论中的组成元素和方面进行标记,较大程度涵盖 e-commerce 网站中的指标。
Jul, 2022
本研究提供了一个大的数据集,开发了一种标准对学生的评论进行分类,并提出了一种使用大型语言模型进行评论分类的最佳实践,从而建立了一个低成本的定量研究自动化体系,来处理海量的在线学生反馈。
Jun, 2023