Jan, 2024

关于 LLM 在篡改检测领域的能力研究

TL;DR自 2020 年以来,特别是自 2020 年初以来,大语言模型 (LLMs) 已成为解决各种挑战的最强大的人工智能工具,从自然语言处理到各个领域的复杂问题解决。在伪造检测领域,LLMs 能够识别基本的篡改活动。为了评估 LLMs 在更专业领域的能力,我们收集了由各个公司开发的五种不同的 LLMs:GPT-4、LLaMA、Bard、ERNIE Bot 4.0 和通以谦闻。这种多样化的模型允许对它们在检测复杂篡改实例方面的性能进行全面评估。我们设计了两个检测领域:人工智能生成内容 (AIGC) 检测和篡改检测。AIGC 检测旨在测试区分图像是真实还是人工生成的能力。另一方面,篡改检测专注于识别篡改图像。根据我们的实验,大多数 LLMs 能够识别与逻辑不一致的复合图片,只有更强大的 LLMs 能够识别人眼可见的篡改迹象。所有 LLMs 都不能识别精心伪造的图像和由人工智能生成的非常逼真的图像。在伪造检测领域,LLMs 仍然有很长的路要走,特别是在可靠地识别高度复杂的伪造和非常逼真地模仿现实的 AI - 生成图像方面。