BriefGPT.xyz
Ask
alpha
关键词
prompt classifier
搜索结果 - 2
大型语言模型通过嵌入损坏的提示进行遗忘学习
大语言模型的轻便取消学习框架 (ECO) 通过使用提示分类器在推理过程中添加和损坏的提示嵌入来实现知识的取消学习。
PDF
24 days ago
KDD
黑盒生成语言模型中的提示拒绝预测
通过黑盒攻击聊天 GPT 并手动标记其响应构建了一个拒绝分类器, 进而基于这个分类器和 Quora Insincere 问题数据集训练了一个提示分类器, 能预测 ChatGPT 是否拒绝一个给定的问题。
PDF
a year ago
Prev
Next