BriefGPT.xyz
Ask
alpha
关键词
predictive behavior
搜索结果 - 3
训练有素的机器代理人的寻求权力行为可以被预测
研究表明,高级人工智能中的权力寻求行为是一种重要的风险来源,但目前对于这种现象的理论理解还相对有限。本文构建在现有的理论基础之上,研究了训练过程如何影响权力寻求激励,并证明了在一些简化的假设下,这种激励仍然可能存在于受过训练的智能体中,同时
→
PDF
a year ago
ACL
评估神经机器翻译的解释方法
本研究提出了一种基于神经机器翻译模型预测行为的衡量方法,以衡量解释方法的准确度,并在六个标准翻译任务上量化地评估了几种解释方法。
PDF
4 years ago
ICML
Hydra:用于模型蒸馏的集合多样性保持技术
通过基于共享神经网络体的分布式方法 Hydra 来提取集合的多样性,分散集合的信息来提高模型收缩和泛化的性能.
PDF
4 years ago
Prev
Next