法语书面叙述中直接引语的自动标注

ACLJun, 2023

法语书面叙述中直接引语的自动标注

Automatic Annotation of Direct Speech in Written French Narratives

Noé Durandard, Viet-Anh Tan, Gaspard Michel, Elena V. Epure

TL;DR本研究旨在为法语语言创建统一的框架，以设计和评估直接言语的自动标注模型，探索了基于规则或深度神经网络的方法，并设计了全面评估以便针对泛化提供更好的方案。

Abstract

The automatic annotation of direct speech (AADS) in written text has been often used in computational narrative understanding. Methods bas

automatic annotation direct speech french deep neural networks narrative understanding

发现论文，激发创造

自动端到端语音理解的轻量化实现

这篇论文研究了自我监督模型在大语音语料库中训练的近期进展，并比较了几种学习策略以减少计算时间和能源消耗成本，但保持竞争性能表现。

Jul, 2022

FRACAS: 一份用于新闻中归属关系的法语标注语料库

本文介绍了一个手动注释的法语新闻语料库，用于引述提取和来源归属。语料库详细描述了数据选择和注释指南，统计了引述类型的平衡情况，并展示了参与手动标注的 8 名注释员之间的高的注释者一致性。

Sep, 2023

使用法语翻译扩充 Librispeech：一种用于直接语音翻译评估的多模态语料库

本文介绍了使用 LibriSpeech 增强现有单语语料库的方法，建立起一种包含源语言中的语音与目标语言中的文本的大型开放式平行语料库，并给出了相应的处理细节和手动评估结果，该平行语料库可以用于直接语音翻译或其他口语翻译实验。

Feb, 2018

自动字幕直接语音翻译

本论文提出了一种直接自动生成目标语言字幕及相应时间戳的自动字幕模型，与现有的级联模型相比，在提供高质量字幕的同时也具有更高的一致性和维护单一模型的优点。

Sep, 2022

基于序列到序列模型的直接语音到语音翻译

该研究提出了一种基于注意力机制的端到端学习的序列到序列神经网络，能够直接将一种语言的语音翻译成另一种语言的语音，无需中间文本表示，该方法通过学习将语音谱图映射到目标语言的谱图，同时也演示了译后语音合成的能力。研究在两个西班牙语到英语的语音翻译数据集上进行了实验，证明了该方法在这个极具挑战的任务上的可行性。

Apr, 2019

直接语音转文本翻译的最新进展

本文综述了直接语音翻译的当前技术状况，将现有研究工作分为三个方向：建模负担，数据稀缺和应用问题，并提出了未来工作的一些有前途的方向。

Jun, 2023

对话语言的自动语音识别系统评估：语言学视角

本文以法语为案例研究，从语言学的角度探讨自动语音识别系统在复杂语境下的识别准确度，并解决了法语同音词的歧义问题，提高了法语语音转写准确度。

Nov, 2022

对话翻译篇章语料库的自动构建

本文提出一种新方法，自动构建对话机器翻译的平行话语语料库，经实验表明，采用该方法可以显著提高翻译质量，同时公开了大约 10 万条已经手动标注了发言者和对话边界的平行话语数据。

May, 2016

半监督语音混合训练声学模型

本文主要介绍了对 Frisian—Dutch code-switching 语音进行自动化标注和学习的几种方法，并探索了扩充语音数据的方法以提高类似语音识别模型的效果的研究。

Oct, 2018

利用时延神经网络进行自动语音语言识别

本研究构建并训练了一种基于自动语音识别技术的语言识别系统，可自动识别阿拉伯语、西班牙语、法语和土耳其语，并通过投票方式进行预测，准确率很高。

May, 2022