本文介绍了多语言机器翻译中干扰现象的主要因素,以及如何通过控制模型大小、数据大小和采样温度来减轻干扰并提升性能。
Dec, 2022
翻译包含源语言的强信号,使得从单语文本中还原出源语言的语言树成为可能。源语言干扰是翻译文本最显著的特征,超越了更微妙的翻译普遍属性信号。
Apr, 2017
通过本文的研究表明,AI 技术的推广仍存在技术语言偏见的问题,这导致一些系统无法正确地表达来自其他社区的概念,从而忽视多样性和边缘化语言社群的需求和世界观。
Jul, 2023
本文通过挖掘技术文档中的文本 - 表达式对来训练一个基于语义分析的模型,以学习高级文本描述和目标文档中表现函数或代码模板的形式表示之间的翻译对应关系,并在 16 个新颖数据集上报告了新的基线结果,包括 7 种自然语言的九种流行编程语言的标准库文档和一些 UNIX 实用程序手册。
May, 2017
本研究通过系统研究表明,多语言模型存在负干扰问题,即共享参数对高资源语言也有削弱效果。我们发现多语言模型中存在语言特定的参数,用元学习算法训练这些参数可以规避负干扰问题,提高跨语言泛化能力。
Oct, 2020
本文介绍了一种利用技术自动帮助人们适应多样化的交流方式的方法,以案例研究为例,旨在通过提供替换建议以实现特定交流环境下预期礼貌水平的准确传达,通过两种真实通信情境的评估,我们展示了这种方法的可行性,并证明它可以减少在两种情况下,讲话者和听众之间的意图不一致的潜在可能性。
Nov, 2020
通过调查,我们着重讨论了语言生成中社会偏见的数据和技术对偏见的影响及降低偏见的进展,并进行了实验来量化解码技术的影响,提出了语言生成应用公平和包容性考虑的重要性。
May, 2021
现代现实世界面临的问题比科学问题更具挑战性,而弗纳茨基的智能层论点呼吁建立一种能够克服学科壁垒并提高跨学科互动和现代科学效率的科学世界观。然而,目前仍缺乏系统方法和普遍接受的有效科学理论,能够提供跨学科知识。跨学科互动是现代科学发展的标准,同时一个新的跨学科理论正在实际上被创造,并且这个过程已经多次重复,从学科个体或小组,通过跨学科互动,朝着创造整体性的科学世界观的方向不断接近。
Nov, 2023
本文旨在提供科学领域中的文本修订和写作援助的概述,探讨科学写作的特殊性,包括研究文章中常用的格式和惯例,以及各种可用于文本修订的写作援助工具。
Mar, 2023
本文研究机器翻译中偏见放大的问题,探究算法的偏见增强对语言是否会产生贫化作用。作者测试了不同的数据驱动机器翻译范式,并发现所有测试的语言对中,都存在词汇和形态上的丧失。
Jan, 2021