关键词machine translation evaluation
搜索结果 - 12
- 零射击机器翻译评估对于印度低资源语言有多好?
机器翻译评估在高资源语言上的研究已有所涉及,但基于近期数据和模型的增加,对低资源语言的评估也引起了兴趣。本文针对低资源的印度语言,即阿萨姆语、卡纳达语、迈蒂利语和旁遮普语,通过收集足够的多维度质量度量和直接评估注解,构建测试集并使用元评估方 - ICLRMT-Ranker: 无参考系统间排序的机器翻译评估
机器翻译评估已被传统上视为回归问题,但这种方法存在两个限制:缺乏可解释性且人工评注者难以给出一致的分数;在真实的场景中,大多数评分方法基于(参考翻译)对,限制了它们的适用性。本研究提出一种新的评估方法,将无参考机器翻译评估转化为配对排序问题 - 在源语言中迷失:大型语言模型如何评估机器翻译的质量
大型语言模型在机器翻译评估任务中取得了显著的成果,然而关于它们如何利用提供的数据进行评估仍存在知识空白。本研究旨在探索大型语言模型如何利用源语言和参考信息进行评估,从而更好地理解大型语言模型的工作机制。通过设计不同的输入模式和模型类型进行受 - xCOMET: 透明的机器翻译评估通过精细化错误检测
本研究介绍了一种名为 xCOMET 的开源学习度量方法,它融合了语句级评估和错误跨度检测能力,并展现出在各种评估类型(语句级、系统级和错误跨度检测)方面的最先进性能,同时突出和分类错误跨度,从而丰富了质量评估。通过稳健性分析和压力测试,我们 - 机器翻译评估的共形化
本文研究机器翻译的不确定性评估方法,发现目前大多数方法对模型不确定性的估计较低,建议采用分布自由的合规预测法来保证覆盖度,并提出条件合规预测技术来获得每个数据子组的校准子集,从而实现覆盖率均衡。
- EMNLPCOMET: 机器翻译评估的神经框架
介绍了 COMET,这是一个使用神经网络的多语言机器翻译评估模型,它利用了跨语言预训练语言建模的最新进展,通过同时使用源输入和目标语言的参考翻译来更准确地预测机器翻译的质量,并在 WMT 2019 指标共享任务中获得了新的最优表现,并展示了 - EMNLP通过零样式改写实现多语言自动机器翻译评估
使用序列到序列的释义器作为人类参考的评估工具,将机器翻译评估任务转化为对机器翻译输出进行评分的任务。通过将释义技术视为零射任务,将释义器训练为多语言 NMT 系统,并将其应用于质量估计任务中,以条件化源,而不是参考,发现其在各种语言对中的表 - MM机器翻译评估与社区问答相遇
本文将机器翻译评估方法应用于另一个问题:社区问答中的答案排序,采用一种结合 MTE 特征、丰富的句法和语义嵌入、高效建模复杂非线性交互的成对神经网络架构。评估结果表明 MTE 特征和成对神经网络架构都对结果有着显著的贡献,具有最先进的性能。
- 神经网络机器翻译的两两评估
本文介绍一种利用神经网络在成对翻译评估中选出最佳翻译的新方法,该方法基于单词和句子嵌入形成紧凑的分布式向量表示,并利用多层神经网络对参考文本和两个翻译之间的交互进行建模,从而可以高效地学习和分类,且与人类评估结果的相关性不亚于当前技术水平的 - 使用语篇结构进行机器翻译评价的 DiscoTK
本文提出了新颖的自动度量标准,使用议论结构和卷积核比较自动翻译的议论树和人类参考的议论树,并通过五种转换技术和增强基于修辞结构理论的基础议论树表示的方法,并将其得分结合成一个综合评分。最后,从 ASIYA MT 评估工具包中添加其他指标,并 - 神经网络进行机器翻译评估
使用神经网络在配对设置下进行机器翻译评估的框架,以从一对假设中选择更好的翻译为目标。该框架将参考和两个假设的词汇、句法和语义信息嵌入到紧凑的分布式向量表示中,并提供了一个与人类判断相关的 MT 评估度量。
- SIGIR英语和阿拉伯语社区问答的解决方案
该研究研究了应用不同类型的特征来学习对社区问答中的问题重新排序的影响,并在 SemEval-2016 的两个数据集上测试了我们的模型。该研究表明,使用句法树核和包 - 词特征能够提高重新排序的效果。