BriefGPT.xyz
大模型
Ask
alpha
关键词
detection ability
搜索结果 - 2
ReMoDetect:奖励模型识别对齐 LLM 的生成
通过对大型语言模型的对齐训练以及奖励模型的检测能力,本文提出了两种训练方案用于提高对 LGM 生成文本的检测效果,并在六个文本领域的十二个对齐模型上进行了广泛的评估,展示了最先进的结果。
PDF
a month ago
水印式 LLM 的统计理解的改进
本文研究了大型语言模型(LLMs)的水印问题,并将其模型畸变和检测能力之间的权衡视为一个基于 Kirchenbauer 等人(2023a)的绿 - 红算法的约束优化问题。通过该优化问题的最优解,我们证明了其具有良好的解析特性,从而更好地理解
→
PDF
3 months ago
Prev
Next