- 争议的概念映射
对在线新闻媒体中的争议进行定性分析,使用形式概念分析和传统经济学推导概念争议图,能够评估争议的多样性、复杂性和潜在偏见,通过概念格图在新闻文章之间进行导航。
- ACLCoUDA: 通过统一数据增强评估连贯性
基于语言模型的大数据时代,一种名为 CoUDA 的数据增强框架针对语篇连贯性评估,通过全局和局部方面的增强策略,包括生成式模型生成增强样本以及综合评估等手段,取得了在连贯性评估任务中的最先进性能。
- Disco-Bench: 一种考虑语篇的语言模型评估基准
该论文提出了一个可以评估处理自然语言时的句子内语篇特征的精细化预训练模型,该模型包含 9 个文献领域的测试集,涵盖了许多超出了跨句子属性的问题。
- AI 生成图像:‘现成品’的新时代
本文旨在研究生成 AI 系统如何创造艺术品,探讨 AI 系统生成的图像是否被视作艺术品,分析 AI 生成的图像在哲学上的地位并通过视觉属性展现作为 “就绪品” 的艺术性。
- 拓展可持续人工智能视角:人工智能系统综合可持续性标准和指标
本文提出基于 19 项可持续性标准和 67 个指标的 “可持续人工智能 (SCAIS)” 框架,为意识到 AI 系统的开发和应用提供了实用的标准和工具。
- 大型语言模型与交流在工程设计中的机遇
本文介绍了大型语言模型如何贡献于设计话语,并自动化其中创造性与推理的部分,例如模拟、实验、拓扑优化等过程,从而构建一套可操作的、以话语为中心的设计框架。
- 提取式总结不忠实:提取式总结中广泛的不忠实问题调查
本论文通过定义五个宽泛的不忠实问题类型(包括和超越非蕴涵)以及其他误导信息,论证了导致摘要不忠实的核心问题主要出现在 extractive summarization 中的指代和话语上,提出了新的检测误差的方法 ExtEval,并指出现存的 - ACL基于 Transformer 神经摘要模型的篇章树预测
使用预训练的神经网络提取文档级别的语篇树,研究发现总结中存在依存和从属语篇信息,这种信息通常被编码为单个头部,覆盖长距离和短距离的语篇依赖性。实验结果表明,学习到的语篇信息具有普适性和领域之间的可传递性。
- ACLDAGN: 面向逻辑推理的语篇感知图网络
本文提出了一种使用基于话语的信息汇总处理逻辑推理 QA 的方法 ——DAGN,它将话语信息编码成一种图形式,并通过一个图形网络学习话语感知特征,实现了在两个 QA 数据集中具有竞争力的结果,源代码可在 https URL 上获得。
- COLING通过话语增强从情感注释到情感预测
研究新架构用于情感分析的任务,结合了大规模的 MEGA-DT treebank 以及基于混合 TreeLSTM 分层注意模型的神经架构,通过情感相关的话语增强情感预测性能,实验结果显示,性能优于使用先前基于人类注释数据训练的良好建立的话语解 - WWW不要误解我:在线讨论中意图与感知的比较
探索和比较在线公共讨论参与者意图和他人的感知,研究发现他们之间的错位与评论的未来健康有关,尤其是在表达事实与观点方面的错位。
- EMNLP论语用和篇章语境在确定论点影响力中的作用
本研究提出了一個新的數據集,旨在研究論證時實際情境和語境對論據質量的影響,並提供整合了語境的預測模型,展示其在預測特定論證中所使用的論點對外界的影響時比僅依賴於論點語言特徵的模型更加準確。
- WWW什么改变了你的想法:动态话题和话语在论辩过程中的作用
该研究提出了一种新的神经模型来动态跟踪论证对话中主题和话语变化对说服力的影响,并在社交媒体和最高法院的论证对话上进行了实验验证。实验结果表明该模型能够有效地辨别具有说服力的论证,并发现主题和话语对说服力都有帮助,但优秀的话语风格可能会在社交 - 数据未定义:大数据定义概述
本文尝试对 “大数据” 这一常用术语进行统一定义,以解决其多样性和歧义性给相关讨论带来的影响。
- ACL基于词汇化树相邻文法的话语锚定
本文讨论了一种基于词汇全面匹配的 Tree-Adjoining Grammar,用于研究语篇,并提出三种语篇意义的来源:基本数理语义,预设语义和一般性的推断。
- ACL基于意图的分割:人类可靠性与语言线索的相关性
本研究通过人类对自然讲话文本的分段来评估语篇分割与三种语言线索(指代名词短语,提示词和停顿)之间的关联性,并使用信息检索度量对其进行量化分析。