BriefGPT.xyz
Ask
alpha
关键词
argument quality
搜索结果 - 5
大型语言模型可靠的论点质量标注员吗?
使用最新的大型语言模型作为论证质量评估的代理者,研究了模型、人类专家和新手评估者之间的一致性,结果表明大型语言模型在大多数质量维度上与人类专家之间具有适度高的一致性,并且使用大型语言模型作为额外的评估者可以显著提高评估者间的一致性,因此提出
→
PDF
3 months ago
EMNLP
建模人类标签变异的建筑甜点:以论证质量为例,最好相关视角!
通过对两个论证质量分类任务(论证具体性和结论的有效性 / 新颖性)的研究,我们发现推荐系统架构相对于多数标签模型能使得个体标注者的 F1 得分提高高达 43%,这表明在处理主观性时,与个体观点相关的方法是可行的。
PDF
8 months ago
论述中恰当语言的建模
本文首次运用论证研究中经过验证的基于修辞学规范的理论,构建了一个 14 维度的新的不适当语言分类,建立了一个 2191 个论点的基准分类语料库,其中所有维度都可以在该语料库上进行计算建模。实证分析支持分类体系全面涵盖了适宜性的概念,与论据质
→
PDF
a year ago
用相关知识来定位辩论质量评估的环境
提出了一种基于上下文知识的新颖的 SPARK 方法,使用大型语言模型评估和增强语言质量,提供反馈,推断隐藏假设,提供同等质量的论证或反论证,并使用双编码器 Transformer 架构共同考虑原始论证及其增强,实验结果表明,SPARK 在多
→
PDF
a year ago
EMNLP
自动论证质量评估 -- 新数据集和方法
探索自动评估论点质量的任务,通过对 6.3k 个论点进行精细注释,以及 14k 个论点对的高品质论点独立标注,提出基于最近发布的语言模型的神经方法进行论点排序和论点对分类,产生与最先进技术相媲美的结果。
PDF
5 years ago
Prev
Next