Bil-DOS: 双语地铁对话排序系统
本文通过整合多个人机对话数据集,结合用户和系统记号改良预训练模型,提出了对话任务 BERT(TOD-BERT)模型,并通过四个对话应用领域的实验验证,表明 TOD-BERT 在意图识别、对话状态跟踪、对话行为预测、响应选择等方面超过了强对话模型 BERT,并且具有更强的少量数据学习能力。
Apr, 2020
提出了一种名为 BiDeN 的通用对话编码器,用于捕捉对话的时间特征,将预训练语言模型用于编码对话记录是不够充分的,实验证明 BiDeN 在不同的下游任务中都表现出了卓越的效果。
Apr, 2022
本文介绍一种基于神经网络的端到端可训练的目标导向对话系统,以及一种新的数据收集方法,该方法基于一种新型的管道式 Wizard-of-Oz 框架。该方法可用于开发对话系统,帮助用户在餐厅搜索领域自然地交流并完成任务。
Apr, 2016
为了促进多语言代码混合对话模型的开发,我们构建了一个包含代码混合对话的目标导向对话数据集,并在其中使用英语 - 印地语、英语 - 孟加拉语、英语 - 古吉拉特语和英语 - 泰米尔语的多语言版本。
Jun, 2018
本研究提出一项新的任务:针对不同语言的演讲者进行语音对话翻译,构建 SpeechBSD 数据集并进行基线实验,探讨上下文的重要性,提出单语言上下文和双语言上下文两种方式,并使用 Whisper 和 mBART 等方法进行级联语音翻译实验,结果显示在我们的设置中,双语境表现更好。
May, 2023
提供了一种名为 BiSync 的双语写作助手,可以自由地在两种语言中撰写文本,并保持两种语言文本的同步。此外,还包括显示替代翻译和释义等附加功能,旨在促进文本创作。
Jun, 2023
这篇论文介绍了一个名为 IndoToD 的端到端多领域任务导向对话系统基准,用于印尼语。作者通过将两个英语 ToD 数据集转换为印尼语,并通过去成分化来减小注解的规模,提供了一个高质量的数据集。这个基准可以用于评估印尼语和英语 ToD 系统,同时探索跨语言和双语传递学习方法的潜在益处。
Nov, 2023
设计了一个双语 SVS 系统用于英语和汉语普通话的人声合成,并通过使用 CMU 词典与映射规则实现中文和英语歌声之间的共享表示,融合了单语歌唱数据集和已建立的歌声转换技术来生成双语歌声,并探索了双语语音数据的潜在用途。通过实验证实,我们的语言独立表示和相关数据集的融合使得单一模型在英语和 code-switch SVS 中获得了强化的性能,同时保持了中文歌曲的表现。
Sep, 2023