- 使用生成预训练转换器进行多语言自动翻译到英语的机器翻译
使用本地生成预训练转换器(GPT)模型进行零 - shot 黑盒多自然语言翻译成英文文本,评估并比较不同开源 GPT 模型在语言翻译准确性上的表现。
- 像素与预测:GPT-4V 在气象图像分析和预报通信中的潜力
通过评估 GPT-4V 在解释气象图表和向用户适当传达天气风险方面的能力,尽管存在幻觉等挑战,该研究强调谨慎整合 GPT-4V 等工具在气象学中的必要性,强调人工监督和开发可靠、可解释的人工智能。
- 从零开始发展规划类任务的基础模型的案例
基于先前使用预训练的基础模型和微调选项的工作,本研究讨论了从零开始创建全面的基础模型以解决规划类任务的需求,并探讨了其设计考虑因素。我们认为这样的基础模型将为问题解决提供新的高效途径,就像 LLMs 正在为 APS 领域创造的一样。
- 基于 Transformer 基础模型的课程推荐:采用 InfoNCE 损失和语言切换方法
通过采用 Transformer Base Model 来增强计算效能、实现 InfoNCE Loss 以进行准确的内容 - 主题匹配,并采用语言切换策略以消除与翻译相关的歧义,这一研究提出的 Curriculum Recommendati - 关于将大型语言模型(LLMs)纳入自动规划和调度(APS)的前景展望
自主规划和调度是人工智能中增长最快的领域之一,本研究通过对 126 篇论文进行全面检视,调查了 LLMs 在地址规划问题的各个方面时的独特应用,并提出了八个类别:语言翻译、计划生成、模型构建、多智能体规划、交互规划、启发式优化、工具集成以及 - 用机器翻译控制目标语言的正式特征
研究探索了在使用机器学习方法将英语翻译成带有形式化特征语言时,如何解决形式化信息缺失的问题,通过使用印地语作为示例数据,在形式化受控环境中训练双语模型,并与预训练的多语言模型在类似环境中的性能进行比较。主要建模方法是利用转换器模型,通过比较 - TRAVID:一种端到端的视频翻译框架
本文介绍了一种视频翻译系统,不仅能够翻译语言,还能将翻译的声音与说话者的唇部运动同步。该系统专注于翻译印度各种语言的教育讲座,在低资源环境中也能高效运行。通过将目标语言与说话者的唇部运动结合,并使用语音克隆技术将它们与说话者的声音匹配,我们 - 融合语音和文本改进语音翻译
该研究提出了 FST 跨模态模型,支持语音、文本和语音文本融合三种不同类型的输入模态进行翻译,技术包括多模态对齐等方法,实验结果表明该模型在多项测试中比传统方法有显著提升,尤其是在语音翻译领域。
- 利用双向流形对齐学习可逆嵌入映射
我们提出了一个双向流形对齐(BDMA)算法,通过显式地训练它成为双射,来学习两个流形之间的非线性映射。我们通过针对语言对而不是个别的有向源和目标组合训练模型来演示 BDMA,从而将模型数量减少了 50%。我们表明,在 “正向”(源到目标)方 - ACL多语言到英语机器翻译工具、数据和预训练模型
本文提出三种工具:MTData、NLCodec 和 RTG,设计一个能够从 500 种源语言翻译成英语的多语言神经机器翻译模型,支持语言种类很多,且模型容易下载和使用。
- ACL重新思考文档级神经机器翻译
通过合适的训练技术,使用原来的 Transformer 模型可以在涉及长度 2000 个单词的文档级别的翻译中取得比句子级别的模型更好的表现,并且在六种语言的九个文档级别和两个句子级别的数据集上,使用包括 BLEU,四个词法指标,三个新提出 - EMNLP使用知识蒸馏将单语句子嵌入多语言
本文介绍了一种将现有的句子嵌入模型扩展到新语言的简便有效方法,训练基于将翻译后的句子映射到与原始句子相同的向量空间位置的思想,相较于其他多语言句子嵌入训练方法,具有扩展现有模型以增加新语言的简易性、保证向量空间所需属性的易操作性和较低的硬件 - EMNLP神经机器翻译中实现性别准确性
本研究将性别信息加入神经机器翻译系统中,旨在提高语言翻译的准确性。实验结果表明,对于某些语言对,加入性别特征显著提高了翻译质量。
- 使用语言模型作为鉴别器的无监督文本风格转移
本研究提出了一种新的方法,使用目标域语言模型作为辨别器,为生成模型提供更丰富和更稳定的令牌级反馈,以便用于二进制分类器在 GAN-based 无监督风格转换系统中。该模型可使用从生成模型下的连续近似离散采样而训练,且相较于以前使用卷积神经网 - ACL使用目标端形态信息优化基于字符的神经机器翻译解码
该研究论文提出了一种基于字符级别的神经机器翻译方法,引入了目标语言的形态信息加强解码器的性能,适用于翻译形态丰富的语言,如德语、俄语和土耳其语,并通过实验证明了其优越性。
- 循环神经网络在序列学习中的关键评估
本文对于近三十年来产生和实践了重要的循环神经网络(RNN),LSTM 和 BRNN 等模型的研究进行综述,旨在提供一个自成体系的最前沿阐述和历史视角,并引用了相关研究文献。
- MMGoogle 相似度距离
使用基于信息距离和 Kolmogorov 复杂度的新理论构建了从全球网络自动提取相似性的方法,并应用于层次聚类、分类和语言翻译,结果表明使用 Google 距离的二元分类的平均一致性为 87%。