BriefGPT.xyz
Ask
alpha
关键词
adaptive strategy
搜索结果 - 4
上下文化混合集成 Q 学习:以控制先验快速学习
结合强化学习和先验控制器可以获得两个世界中的最佳结果:强化学习可以解决复杂的非线性问题,而控制器可以确保更安全的探索和加快训练。本文提出了一种新的自适应混合强化学习算法,通过动态调整加权来适应强化学习代理当前的能力,从而提高数据效率、探索安
→
PDF
8 days ago
景观感知增长:一点点 Lag 的力量
Efficient pretraining paradigms and growing strategies for Transformer-based models are studied, focusing on early train
→
PDF
a month ago
学习不学习:人工智能中的天性与后天
本文利用数学分析和元学习(或 ' 学习学习 ')框架回答了何时学习这种自适应策略以及何时将启发式行为硬编码的问题。我们发现,生态不确定性,任务复杂性和代理的寿命相互作用对代理执行的元 - 学习度量贝叶斯推断具有关键影响。
PDF
4 years ago
自适应感知的基本极限
研究了基于线性测量和自适应策略下的信号恢复问题,证明了即使采用自适应和复杂的估计算法,也无法显著提高恢复速度。
PDF
13 years ago
Prev
Next