依存架构统一话语资源
本研究提出了一种基于 transformers 的新方法,通过对不同级别单元的上下文化表示进行编码,动态捕捉对话依赖分析所需的信息,并将对话关系识别视为序列标记任务
May, 2022
研究了汉语对话级别的依存分析,利用句法依存和修辞结构理论的思想,开发了一个人工注释的高质量语料库,探索了零样本和少样本场景,并考虑采用基于信号检测的方法将先前存在的句法依存转化为单元话语之间的未见依存的场景。通过单视图和多视图数据选择来获取可靠的伪标签实例,实验结果表明了这些基线的有效性。同时,我们还讨论了有关数据集和方法的几个关键点。
May, 2023
本文介绍了一种基于 Penn Discourse TreeBank 标注语言相关特征的新资源,通过对 TED Talks 进行标注,为中英文翻译和语言技术的发展做出了贡献。该资源注重对计划性口语独白的篇章层面语言特征的标注,而不仅仅局限于书面语,基于多位标注者的协商,该标注方案的可靠性得到了证实。
Mar, 2020
本文介绍了一种自动语篇处理方法 ——Questions Under Discussion(QUD),采用了一种新的语言框架,通过大数据集训练 QUD 解析器从而可以获得强大的性能,同时通过 QUD 分析可以实现文档简化。
Oct, 2022
本研究提出了一种名为 SCUD 的新的语言依存注释标准,并提供了 ConvBank 数据集,以用于在人机对话方面训练依存句法分析模型。实验表明,将模型预训练于公共数据集并在 ConvBank 数据上进行微调可以取得最好的结果,达到了 85.05%的未标注和 77.82%的标注连接准确率。
Sep, 2019
通过构建神经网络模型,模拟句子和段落之间的相互依赖和连续性,并能够连续预测段落中的语篇关系,从而提高隐含的语篇关系分类的效果,并在 PDTB 的基准语料库上取得了最佳性能。
Apr, 2018
我们提出了一种注入了句际依赖结构的话语感知神经主题分割模型,以更好地利用句子之间的主题一致性进行主题边界分割预测,并在英文评估数据集上进行实证研究表明,我们的策略显著提高了神经主题分割器在域内和域外数据上的性能。
Sep, 2022