BriefGPT.xyz
大模型
Ask
alpha
关键词
predictable behavior
搜索结果 - 2
为什么使用规模预测前沿的人工智能模型的下游能力如此困难?
通过使用五个模型家族和十二个多项选择基准测试,我们展示了通过负对数似然性能计算的一系列转换逐渐降低了性能和规模之间的统计关系,同时揭示了导致这种降级的机制:下游度量要求将正确的选择与少量特定的错误选择进行比较,这意味着准确预测下游能力不仅要
→
PDF
a month ago
通过熵率最小化实现可预测的强化学习动力学
提出一种名为可预测性感知强化学习 (Predictability-Aware RL,PA-RL) 的新方法,利用状态序列熵率作为可预测性度量,通过引入基于动作的替代熵来实现行为的可预测性,从而在人机互动场景的强化学习任务中产生更可预测的行为
→
PDF
7 months ago
Prev
Next