使用 HED-IT 进行精调：人工后期编辑对对话式语言模型的影响

Jun, 2024

使用 HED-IT 进行精调：人工后期编辑对对话式语言模型的影响

Fine-tuning with HED-IT: The impact of human post-editing for dialogical language models

Daniela Occhipinti, Michele Marchi, Irene Mondella, Huiyuan Lai, Felice Dell'Orletta...

TL;DR本研究通过调查人类干预对机器生成数据进行微调对话模型的影响，证明了人类后编辑对话相较于自动生成的对话在感知质量上具有显著提高，并且使用后编辑对话进行微调会导致生成输出有明显差异。此外，该研究认为数据质量对较小的模型影响重大，而对较大的模型影响较小，这些发现有助于我们理解人类干预对高质量语言模型训练数据的影响。

Abstract

Automatic methods for generating and gathering linguistic data have proven effective for fine-tuning language models (LMs) in languages le

linguistic data fine-tuning dialogical models post-editing language models

发现论文，激发创造

使用错误注释引导大型语言模型进行机器翻译

通过使用 Multidimensional Quality Metric (MQM) 注释中的外部反馈来引导大型语言模型 (LLMs) 自动对机器翻译进行后编辑，以提高翻译质量。使用 LLaMA-2 模型，通过改变反馈的特性，我们考虑了不同的提示策略，并对 LLM 进行微调以提高其利用所提供指导的能力，实验证明提示 LLMs 对机器翻译进行后编辑，可以改善 TER、BLEU 和 COMET 分数，微调有助于更有效地整合细粒度的反馈，并基于自动和人工评估进一步提高翻译质量。

Apr, 2024

面向专业人员的 NMT 增量调整：用户研究

本文研究使用在线学习方法对神经网络机器翻译系统进行改进，通过用户实验表明改进后的系统在翻译质量、减少人工修改时间等方面有了明显的提升。

Jun, 2019

高效机器翻译语料库生成

本篇论文提出了一种有效且半自动化的方法，用于人工编辑后的机器翻译语料库生成，该方法基于在线训练定制的 MT 质量估计指标并需要人类参与，实现了有待优化问题的优先级排序和最佳解的自动处理。尤其地，该方法解决了人工编辑效率低下，从而降低了人工成本的问题，并通过实验证明了其对机器翻译模型生命周期的作用。

Jun, 2023

神经机器翻译质量与后编辑表现

本研究测试了在专业翻译中使用神经机器翻译（NMT）是否能够节省人工处理时间，并发现更好的 MT 系统确实能够减少英文到捷克文翻译过程中的修改次数，但是质量和编辑时间之间的关系并不是直接的关系，并且与短语词汇表机器翻译不同的是，BLEU 不能稳定预测时间或最终输出质量。

Sep, 2021

分析对数据选择和微调对 LLMs 中的经济和政治偏见的影响

本研究探究了大型语言模型中的经济和政治偏见以及调整细节对其产生的影响，通过使用参数效率微调技术，我们介绍了一种系统的数据集选择、注释和指令调整方法，并通过定量和定性评估评估其有效性，旨在讨论 AI 的道德应用，强调将 AI 部署在符合社会价值观的方式上的重要性。

Apr, 2024

文本摘要中后编辑效果探究

本研究探索了人工智能自动摘要以及人工手动摘要之间的优劣，研究发现人工智能生成的摘要进行后编辑可以提升摘要质量，不过效果因人而异。

Jun, 2022

后编辑比人工翻译快吗？

这项研究针对一家语言服务提供商的真实数据进行了首次大规模的翻译和修订速度调查，结果表明后期编辑通常比人工翻译更快，平均速度数值可能具有误导性，翻译速度高度可变，编辑距离不能作为后期编辑效率的代理因素，因为它与速度的相关性并不强。

Dec, 2023

PePe: 利用用户生成的后编辑进行个性化后编辑模型

本文介绍一种个性化自动后编辑框架来解决机器翻译中反映个人喜好的挑战，其使用鉴别器模块和用户特定参数的模型，在四种不同指标（BLEU、TER、YiSi-1 和人类评估）上优于基线模型。

Sep, 2022

上下文细化的翻译：大型语言模型用于句子和文档级后编辑

利用大型语言模型（LLM）进行神经机器翻译和自动后编辑，并借鉴低秩适配器微调的方法，在句子和文档级别的度量上取得显著改进，同时还研究了利用人工修正来减少后续翻译所需的编辑次数的实际应用场景。

Oct, 2023

神经机器翻译后编辑的在线学习

神经机器翻译需进行后编辑以提高翻译质量，后编辑可作为新的训练数据进行在线学习，本文提出新的优化算法并实验比较在线学习算法，结果表明翻译质量和工作量得到了显著提高。

Jun, 2017