一种模态词典及其在自动标记中的应用

Oct, 2014

一种模态词典及其在自动标记中的应用

A Modality Lexicon and its use in Automatic Tagging

Kathryn Baker, Michael Bloodgood, Bonnie J. Dorr, Nathaniel W. Filardo, Lori Levin...

TL;DR本文介绍了模态词的注释方案、模态词的构建、以及两种使用词汇表和注释方案构建的自动标注工具。使用基于结构的标记工具来在英文 - 乌尔都语训练语料库上注释英文模态，使得机器翻译的质量得到了提高。

Abstract

This paper describes our resource-building results for an eight-week JHU Human Language Technology Center of Excellence Summer Camp for Applied Language Exploration (SCALE-2009) on Semantically-Informed machine translation. Specifically, we describe the construction of a →

modality machine translation lexicon annotation scheme tagger

发现论文，激发创造

基于语义的句法机器翻译中的情态和否定使用

本文描述了为期八周的约翰霍普金斯大学人类语言技术卓越中心应用语言探索夏令营（SCALE-2009）中语义驱动机器翻译（SIMT）的资源和系统构建工作。作者引入了一种新的模态 / 否定（MN）注释方案，基于该方案和词典生成了两个自动化的 MN 标注器，并将其应用于用于翻译的语法框架中，结果显示基于结构的 MN 标注器的标注精确率高达 86％。最终生成的系统有效地提高了翻译质量。

Feb, 2015

基于规则注释和众包的统计模态标注

训练一种自动情态标注器（modality tagger）。在用规则进行简单的情态标注的基础上，通过 Mechanical Turk 逐步提供训练数据集并使用多类 SVM 进行精确的情态标注，解决了训练数据稀少的难题。

Mar, 2015

法律语言中代理人特定义务模态检测

LEXDEMOD 是一份包含英语合同注释的语料库，其标注了关于合同方或代理人的义务性情态语气以及情态触发器，用于支持法律领域中自然语言理解。使用基于 Transformer 的语言模型，我们在 LEXDEMOD 上进行了两个任务的基准测试，即特定代理人的多标签义务情态分类，以及特定代理人的情态和触发器跨度检测，实验表明该语料库的语言多样性可以合理地从租赁转向雇佣和租赁协议，可用于法律领域中的义务情态探测。

Nov, 2022

可能、合理和理想：用于语言处理的基于事件的情态检测

本文提出一种基于事件的情态检测任务，其中模态表达式可以是任何句法类的单词，其中感性标签来自一种综合分类法。该任务通过探讨模态表达式对事件的影响来改善模态事件的检测，同时在 GME 语料库上进行实验。

Jun, 2021

低资源语言的跨语言形态标注

提出了一种适用于低资源语言的模型来训练形态标记器，该模型使用 Wesabie 模型进行打标，通过在语料库中引入 POS 词性标注的元信息，将标记信息从富资源语言映射到贫资源语言，实现了跨语言知识的迁移，可以提高句法分析的效果。

Jun, 2016

盲目性对特征消融有益：蕴含图挖掘

通过使用情态解析器过滤新闻语料库建立蕴涵图，实验证明去除谓词中的情态修饰符（linguistic modality）可提高性能，表明在某些任务中，谓词的情态修饰在实现蕴涵证据方面是有用的（pragmatics of modal modification of predicates）。

Sep, 2021

多模态对人类和机器在翻译和图像字幕中是否有帮助？

本文介绍了 LIUM 和 CVC 为 WMT16 Multimodal Machine Translation Challenge 开发的系统。我们在单模态数据和多模态数据的基础上，探索了各种比较方法，包括基于短语的系统和使用单模态或多模态数据训练的注意力循环神经网络模型。我们还进行了人类评估，以估计多模态数据对于人机翻译和图像描述生成的实用性。根据自动评估指标 BLEU 和 METEOR，我们的系统在这两个任务中获得了最佳结果。

May, 2016

多模态机器学习：概述与分类

多模态机器学习作为一个充满潜力的多学科领域，在不断发展和完善，其普遍的分类包括：表示、翻译、对齐、融合和协同学习。该研究旨在通过共性的分类方式，综合总结目前该领域的研究进展，以期为未来的研究指明方向。

May, 2017

非自回归机器翻译中的语法多模式研究

该论文针对非自回归翻译模型中存在的语法多模式问题进行了系统研究。作者提出了连接时序分类（CTC）和无序交叉熵（OAXE）损失函数来处理不同范围的语法多模式，并设计了一种新的损失函数来更好地处理实际世界数据集中的复杂语法多模式。

Jul, 2022

利用目标词元注释促进术语翻译

该研究提出了一种源数据增强的机器翻译系统，用于术语集成，实验表明该方法在术语翻译时具有实用性和较高的准确性。

Jan, 2021