BriefGPT.xyz
大模型
Ask
alpha
关键词
hazards
搜索结果 - 3
信任与恐怖:文本中显露出的负面偏信和党派消极偏见
通过使用神经网络从文本中提取社会语言学指标,研究证明,有关危险的陈述比有关好处的陈述更具可信度,政治自由派和保守派在分享危险信息的频率上存在差异,并且危险信息与道德愤怒、情绪、威胁词等指标相关,同时与恐惧情绪呈正相关、与喜悦情绪呈负相关。利
→
PDF
a month ago
可下载基础模型微调不断增加的风险
能够下载的预训练模型权重的公开发布,使得细调模型可以避免昂贵的预训练费用。本研究认为,可下载模型的越来越易于细调可能会增加风险,主要体现在降低细调的计算成本、扩大参与共享成本的参与者范围、容易被用于恶意目的、难以监管具有潜在危险能力的模型等
→
PDF
6 months ago
系统安全和人工智能
本章提出了七个防止人工智能系统造成伤害的课程,探讨了系统安全领域的见解,针对公共机构及基础设施中的新应用程序引发的新危害,阐述了诊断和消除新人工智能系统危害的共识缺失,并探讨了有效人工智能管理所需的跨学科方法和共享语言。
PDF
2 years ago
Prev
Next