BriefGPT.xyz
Ask
alpha
关键词
harmful words
搜索结果 - 1
大型语言模型中的过度臃肿导航
通过探索大型语言模型处理和确定查询的安全性的方式以及对有害单词的过度关注的因素,本研究发现模型内部存在着捷径,强调安全性的提示将加剧过度关注有害单词,并介绍了一种名为 Self-Contrastive Decoding (Self-CD)
→
PDF
5 months ago
Prev
Next