BriefGPT.xyz
大模型
Ask
alpha
关键词
language coverage
搜索结果 - 5
使用离散单元进行信任的旁遮普语到英语的直接翻译
我们的研究旨在为低资源语言提供直接的语音 - 语音翻译模型,并探索使用离散的语音单位作为 Transformer 翻译模型输入的性能。结果显示,该模型比语音 - 单位翻译模型的 BLEU 分数高出 3.69。
PDF
4 months ago
将语音技术扩展至 1000 多种语言
通过基于宗教文本的新数据集和有效利用自监督学习的方法,Massively Multilingual Speech(MMS)项目构建了包括 1406 种语言的预训练 wav2vec 2.0 模型、1107 种语言的单一多语言自动语音识别模型、
→
PDF
a year ago
使用 OPUS-MT 实现机器翻译民主化
该论文介绍了 OPUS 生态系统,重点关注开发开放的机器翻译模型和工具,以及它们集成到最终用户应用程序、开发平台和专业工作流程中。论文还讨论了增加语言覆盖范围和翻译质量的使命,并描述了开发模块化翻译模型和面向常规桌面和小型设备的实时翻译的速
→
PDF
2 years ago
GlobalWoZ:将 MultiWoZ 全球化以开发多语言任务导向的对话系统
该论文介绍了一种通过翻译并修改本地实体的对话模板来生成 GlobalWoZ 数据集的方法,以增加多种语言的任务导向对话系统的数据覆盖范围,并提供了一组坚实的基准数据集以进行学习和评估。
PDF
3 years ago
ACL
走向更加公平的问答系统:需要多少更多的数据?
本研究探讨如何通过自动翻译和排列组合技术将已有的数据资源应用到多语种的问答系统中,并进行深入分析和提出未来数据集开发的建议,以提高多语种问答系统的覆盖面。
PDF
3 years ago
Prev
Next