Feb, 2024

大语言模型在社交媒体机器人检测中的机遇与风险

TL;DR社交媒体机器人检测一直是机器学习机器人检测器和对抗机器人策略之间的一场军备竞赛。本研究将这场竞赛提升到了一个新的水平,通过研究最先进的大型语言模型(LLMs)在社交机器人检测中的机会和风险,设计了基于LLM的机器人检测器,并探索了LLM引导的操纵用户文本和结构化信息来逃避检测的可能性。实验结果表明,仅仅在1000个注释示例上进行的指令调优可以产生专门的LLMs,它们在两个数据集上的表现比最先进的基线方法提高了高达9.1%,而LLM引导的操纵策略可以将现有的机器人检测器的性能显著降低高达29.6%,并损害机器人检测系统的校准和可靠性。