BriefGPT.xyz
Ask
alpha
关键词
biased content
搜索结果 - 2
攻击之树:自动破解黑盒 LLM
使用大型语言模型和树状攻击剪枝自动生成越狱(黑盒攻击)的方法,有效地生成恶意、偏见和有毒内容。
PDF
7 months ago
在不同粒度上分析新闻文章中的政治偏见和不公平性
本研究利用一个新的、基于 6964 篇新闻文章的辅助指标标签的语料库,开发了一种神经模型对新闻文章中的政治偏见和不公平进行分析,并从单词到整篇文章的不同层次的文本粒度发现了深刻的偏见模式。
PDF
4 years ago
Prev
Next