本文对传统词嵌入模型与 BERT 模型在人权法庭裁决文本的法条分析任务中的表现进行了比较,实验证明领域特定的 BERT 模型有很大的潜力,而传统的词嵌入模型在与神经网络层结合后也能表现出很强的性能。
Feb, 2022
这篇研究探讨了基于计算语言学的辩论挖掘的方法,通过适应实践数据中的辩论现象和创建一个新的标准语料库以及使用几种机器学习方法来识别辩论组件,证明了在用户生成的网络话语中进行辩论挖掘是可行的但具有挑战性的任务。
Jan, 2016
本综述文章桥接了论证挖掘的理论方法和社交媒体数据诉求的实用方案之间的差距,回顾、比较和分类现有方法、技术和工具,识别了结合任务和特征的积极成果,并最终提出了一个观点架构框架。该理论框架是一种能够识别不同子任务并捕捉社交媒体文本需求的论证挖掘方案,揭示了采用更灵活、可扩展框架的需求。
Jul, 2019
本文是 Dialogue 会议对针对新冠疫情(疫苗、隔离和戴口罩)话题的社交媒体评论进行第一次俄语言论分析系统及其竞赛的组织者报告,由 NLI 变体的 BERT 体系结构获胜,希望为俄文文本的论证挖掘研究提供帮助。
Jun, 2022
通过将英文数据翻译并投影到目标语言(西班牙语)的方法,我们有效地生成了无需手动干预的带注释数据,并证明了其优于使用大型屏蔽多语言语言模型的零 - shot 跨语言方法。同时,我们还展示了西班牙语中自动生成的数据如何用于改善英语评估设置中的结果。
Jan, 2023
探索使用多个粒度层次的法律论证挖掘,使用 Longformer 模型进行令牌级别的分类来更准确地识别法律论证的元素,并提供更大的灵活性来分析法律文本并获得更多有见地的信息。
Oct, 2022
本文提出了一种计算模型,该模型结合了微观层面和宏观层面的论证模型,基于 Rhetorical Structure Theory 利用上下文信息来预测关系,使用候选选择方法自动预测讨论中被其他参与者针对的论点,其结果优于最新的 state-of-the-art 方法。
Apr, 2020
本研究探索了利用多语言 BERT 模型进行传输学习,以识别非英语语言中的论证挖掘任务。结果表明,机器翻译的质量对于论点立场和证据检测任务而言很好,但对于论证质量评估任务来说则不太适合。研究还展示了语言选择和它们之间的关系对结果模型的准确性产生了影响,并提供了一个多语言的人工数据集,以方便进行传输学习的效果评估。
Oct, 2020
本文介绍了一个新的自然语言处理任务和数据集,基于美国民事诉讼领域,旨在为评估现代法律语言模型提供具有挑战的任务。研究表明,fine-tuning 法律 transformer 模型相对于随机基线模型更有优势,但推理法律论点的实际能力仍是具有挑战性的开放性研究问题。
Nov, 2022
对于模拟法律推理和案例论证以支持决策的论文进行了回顾,揭示了传统符号逻辑与 AI 技术,并探讨了在法律自然语言处理方面的最新进展,提出融入专家知识以在符号逻辑和数据驱动方法中保持可拓展性和解释性的可能性,同时识别出挑战和现代自然语言处理模型和方法的潜力。
Jun, 2024