BriefGPT.xyz
Ask
alpha
关键词
ai influence
搜索结果 - 2
ICML
与可变且可影响奖励函数保持 AI 对齐
现有的 AI 对齐方法假设偏好是静态的,这是不现实的:我们的偏好会改变,甚至可能受到与 AI 系统的交互的影响。为了阐明错误地假设偏好是静态的后果,我们引入了动态回报马尔可夫决策过程 (DR-MDPs),明确地模拟偏好变化和 AI 对其的影
→
PDF
a month ago
大型语言模型作为公司游说者
用大型语言模型辅助企业游说,帮助识别相关立法并草拟游说信,引发对人工智能游说的界限问题。
PDF
2 years ago
Prev
Next