Jul, 2024

基于大型语言模型的低资源和高资源语言机器翻译幻觉检测

TL;DR本研究解决了机器翻译中幻觉检测的关键问题,尤其是在低资源语言中的显著挑战。通过评估大型语言模型和语义相似性,研究发现不同模型选择对性能影响显著,Llama3-70B在高资源语言中的表现超过了前沿模型,而Claude Sonnet在低资源语言中表现优于其他模型,为机器翻译的可靠性提供了新的见解。