一种模态词典及其在自动标记中的应用
本文描述了为期八周的约翰霍普金斯大学人类语言技术卓越中心应用语言探索夏令营(SCALE-2009)中语义驱动机器翻译(SIMT)的资源和系统构建工作。作者引入了一种新的模态 / 否定(MN)注释方案,基于该方案和词典生成了两个自动化的 MN 标注器,并将其应用于用于翻译的语法框架中,结果显示基于结构的 MN 标注器的标注精确率高达 86%。最终生成的系统有效地提高了翻译质量。
Feb, 2015
训练一种自动情态标注器(modality tagger)。在用规则进行简单的情态标注的基础上,通过 Mechanical Turk 逐步提供训练数据集并使用多类 SVM 进行精确的情态标注,解决了训练数据稀少的难题。
Mar, 2015
LEXDEMOD 是一份包含英语合同注释的语料库,其标注了关于合同方或代理人的义务性情态语气以及情态触发器,用于支持法律领域中自然语言理解。使用基于 Transformer 的语言模型,我们在 LEXDEMOD 上进行了两个任务的基准测试,即特定代理人的多标签义务情态分类,以及特定代理人的情态和触发器跨度检测,实验表明该语料库的语言多样性可以合理地从租赁转向雇佣和租赁协议,可用于法律领域中的义务情态探测。
Nov, 2022
本文提出一种基于事件的情态检测任务,其中模态表达式可以是任何句法类的单词,其中感性标签来自一种综合分类法。该任务通过探讨模态表达式对事件的影响来改善模态事件的检测,同时在 GME 语料库上进行实验。
Jun, 2021
提出了一种适用于低资源语言的模型来训练形态标记器,该模型使用 Wesabie 模型进行打标, 通过在语料库中引入 POS 词性标注的元信息,将标记信息从富资源语言映射到贫资源语言,实现了跨语言知识的迁移,可以提高句法分析的效果。
Jun, 2016
通过使用情态解析器过滤新闻语料库建立蕴涵图,实验证明去除谓词中的情态修饰符(linguistic modality)可提高性能,表明在某些任务中,谓词的情态修饰在实现蕴涵证据方面是有用的(pragmatics of modal modification of predicates)。
Sep, 2021
本文介绍了 LIUM 和 CVC 为 WMT16 Multimodal Machine Translation Challenge 开发的系统。我们在单模态数据和多模态数据的基础上,探索了各种比较方法,包括基于短语的系统和使用单模态或多模态数据训练的注意力循环神经网络模型。我们还进行了人类评估,以估计多模态数据对于人机翻译和图像描述生成的实用性。根据自动评估指标 BLEU 和 METEOR,我们的系统在这两个任务中获得了最佳结果。
May, 2016
多模态机器学习作为一个充满潜力的多学科领域,在不断发展和完善,其普遍的分类包括:表示、翻译、对齐、融合和协同学习。该研究旨在通过共性的分类方式,综合总结目前该领域的研究进展,以期为未来的研究指明方向。
May, 2017
该论文针对非自回归翻译模型中存在的语法多模式问题进行了系统研究。作者提出了连接时序分类(CTC)和无序交叉熵(OAXE)损失函数来处理不同范围的语法多模式,并设计了一种新的损失函数来更好地处理实际世界数据集中的复杂语法多模式。
Jul, 2022