BiSync:一款用于同步单语文本的双语编辑器
探讨了将目标序列转化为源序列的翻译方法以及对其进行细化、优化的多种实验,得出了一种基于编辑的通用系统可以与专门针对此任务训练的系统相媲美甚至优于这些系统的结论。
Oct, 2022
设计了一个双语 SVS 系统用于英语和汉语普通话的人声合成,并通过使用 CMU 词典与映射规则实现中文和英语歌声之间的共享表示,融合了单语歌唱数据集和已建立的歌声转换技术来生成双语歌声,并探索了双语语音数据的潜在用途。通过实验证实,我们的语言独立表示和相关数据集的融合使得单一模型在英语和 code-switch SVS 中获得了强化的性能,同时保持了中文歌曲的表现。
Sep, 2023
该论文介绍了 Synslator,这是一款用户友好的计算机辅助翻译工具,不仅支持交互式机器翻译(IMT),而且在实时翻译记忆的在线学习方面表现出色。通过评估,我们确认了在线学习的有效性,并观察到使用 Synslator 的交互功能将后期编辑效率提高了 13%。
Oct, 2023
本研究提出了一种创新的同步双语联结主义时间分类 (CTC) 框架,利用双重 CTC 来填补语音翻译任务中模态和语言之间的差距。通过将转录和翻译作为 CTC 的并行目标,我们的模型填补了音频和文本以及源语言和目标语言之间的差距。在 CTC 应用的最新进展基础上,我们还开发了一个增强的变体 BiL-CTC+,在资源受限场景下创造出了新的最先进性能。有趣的是,我们的方法还显著提高了语音识别性能,揭示了跨语言学习对转录的影响,并展示了其广泛的适用性。源代码可以在此 https URL 获取。
Sep, 2023
提出了一个计算机辅助文本编辑的框架,通过神经序列到序列建模和引入一个以输入句子和更改标记为输入的神经网络来解决翻译后编辑和改写问题,并通过用户研究评估了该模型的效果。
Nov, 2017
这篇论文描述了 BWB 这个由专家将汉语小说翻译成英文的大型平行语料库,以及一个用于探究机器翻译系统建模各种语篇现象的标注测试集,希望这个资源能够为更多的文档级机器翻译工作提供指导和灵感。
Oct, 2022
使用技术不对称导致很多人被迫在他们文化水平较低的语言环境中使用网络。我们提出了一种挖掘语音音素混淆的方法,然后将这些混淆应用于一个生成模型,从而合成损坏的第二语言文本,在人员评估中得出了合理的损坏结果,该方法还应用于流行的语言理解基准 SuperGLUE,并揭示了现有技术的不足之处。我们还引入了一项新的音素预测预训练任务,使得字节模型的性能接近 SuperGLUE,并 release 了 FunGLUE 基准,以促进更多关于音素鲁棒性语言模型的研究。据我们所知,FunGLUE 是第一个在文本中引入 L1-L2 交互的基准测试。
Jul, 2023
研究了一种在会议或会谈中进行同时语音翻译的应用程序,并探讨了使用在线口语翻译模型建立在线口语翻译系统的一般方法以及针对这种方法采用不同的语言和体系结构的多语种模型与端对端模型的能力。所提出的方法通过对 TEDx 语料库的实验证明,相似的潜在优势。
Mar, 2022
信息同步的挑战在于跨语言的半结构化数据同步,我们提出了一个新的数据集 InfoSyncC 和一个两步骤的表格同步方法来解决这个问题。该方法包括信息对齐以映射行和信息更新以更新多语言表格中对齐表格的缺失 / 过时信息。在 InfoSync 上的评估结果显示,信息对齐达到了 87.91 的 F1 分数(en<->non-en)。通过人工协助的维基百科编辑,信息更新方法在维基百科上达到了 77.28% 的有效性。
Jul, 2023
我们介绍了 mEdIT,这是对写作辅助的最新文本编辑模型 CoEdIT 进行的多语言扩展。通过指导调整,我们使用多语言大型预训练语言模型(LLMs)进行微调训练 mEdIT 模型,它被设计成根据用户的自然语言指令来指定所需文本的属性,如德语的 Grammatik korrigieren 或西班牙语的 Parafrasee la oración。通过对多个公开可用的人工标注文本编辑数据集进行数据整理,我们构建了 mEdIT,并详细介绍了其设计与训练,并展示了其在其他多语言 LLM 的许多多语言文本编辑基准测试中的强大表现。我们还发现,mEdIT 在基于多语言的基线上能够有效地进行新语言的泛化。我们在此 URL 公开发布了我们的数据、代码和训练模型。
Feb, 2024