BriefGPT.xyz
Ask
alpha
关键词
normative concepts
搜索结果 - 2
生成式人工智能伦理的映射:一项全面的范围审查
通过分析 378 个伦理问题的 19 个主题领域,本研究综述了生成人工智能伦理问题的分类和排名,主要关注大型语言模型和图像生成模型,为学者、从业人员和政策制定者提供了关于公平性、安全性、有害内容、幻觉、隐私、交互风险、安全性、社会影响等伦理
→
PDF
5 months ago
大型语言模型内在的道德自我修正能力
通过三个实验,我们得出结论:通过人类反馈训练的强化学习语言模型具有道德自我纠正的能力,具备遵守伦理原则的潜力。
PDF
a year ago
Prev
Next