本文提供了一种新颖的注释方法,以捕获德语商业模型学生写作的有关论点和前提以及它们之间的关系,并通过 50 篇说服性文章上的标注研究来评估我们的注释方案,呈现了我们的免费语料库以及指南,以鼓励未来针对学生的论述写作支撑系统的设计和开发的研究。
Oct, 2020
通过将英文数据翻译并投影到目标语言(西班牙语)的方法,我们有效地生成了无需手动干预的带注释数据,并证明了其优于使用大型屏蔽多语言语言模型的零 - shot 跨语言方法。同时,我们还展示了西班牙语中自动生成的数据如何用于改善英语评估设置中的结果。
Jan, 2023
本研究探索了论证质量排序的挑战性任务,构建了一个被精心注释的语料库来解决这个问题,并进行了综合评估,最后提出了一种神经方法来解决此问题。
Nov, 2019
这篇研究探讨了基于计算语言学的辩论挖掘的方法,通过适应实践数据中的辩论现象和创建一个新的标准语料库以及使用几种机器学习方法来识别辩论组件,证明了在用户生成的网络话语中进行辩论挖掘是可行的但具有挑战性的任务。
Jan, 2016
为了计算化支持论证写作,需要挖掘论证结构和品质评分之间的相互作用,然而,目前尚未发布包含地面实论文品质标注的论证挖掘语料库。通过提供一份德语语料库,其中包括两个年龄组的学生写的 1,320 篇论文,并手动注释了论证结构和品质,填补了这一研究空白,并提出了论证挖掘和文章评分的基线方法,同时分析了两个任务之间的相互作用,为品质导向的论证写作支持奠定了基础。
Apr, 2024
本文是 Dialogue 会议对针对新冠疫情(疫苗、隔离和戴口罩)话题的社交媒体评论进行第一次俄语言论分析系统及其竞赛的组织者报告,由 NLI 变体的 BERT 体系结构获胜,希望为俄文文本的论证挖掘研究提供帮助。
Jun, 2022
本文介绍了通过自动检测审稿人提出的论点和类型来研究同行评审过程的内容和结构,从而评估其效率和功效。作者首先收集了来自机器学习和自然语言处理领域的 14.2K 份审稿意见,并对其中的 400 份进行了注释,最终得出了一些结论并提出了未来新的挑战。
Mar, 2019
本文介绍了一个全面的、高精度的基于话语级查询的语料库广泛的 Argument Mining 系统,通过将适当索引的大型语料库上的句子级查询与迭代式注释方案结合起来,解决了数据中的固有标签偏差,标注手册所需的空间样本的区域,从而获得高精度的排名前几的候选项。
通过语料库分析外语学习者汉语中的论证结构错误,结合语义角色标注与中国语 PropBank 的使用,发现学习者文本对于母语者是可理解的,提出了初步分析关于论证结构的能力错误,特别是与词序、词选择、缺乏命题以及论证和附加性困扰相关的口语错误。
Aug, 2023
本综述文章桥接了论证挖掘的理论方法和社交媒体数据诉求的实用方案之间的差距,回顾、比较和分类现有方法、技术和工具,识别了结合任务和特征的积极成果,并最终提出了一个观点架构框架。该理论框架是一种能够识别不同子任务并捕捉社交媒体文本需求的论证挖掘方案,揭示了采用更灵活、可扩展框架的需求。
Jul, 2019