BriefGPT.xyz
大模型
Ask
alpha
关键词
instruction-centric responses
搜索结果 - 1
LLM 的以指令为中心的回应有多 (不) 道德?揭示安全保护措施在有害查询中的脆弱性
在本研究中,我们探讨了大型语言模型(LLMs)在安全性和道德用途方面的一个日益关注的问题。尽管这些模型有潜力,但它们可能被各种复杂的方法欺骗,产生有害或不道德的内容,其中包括 “越狱” 技术和有针对性的操纵。我们的研究集中在一个特定的问题上
→
PDF
4 months ago
Prev
Next