BriefGPT.xyz
Ask
alpha
关键词
primal-dual framework
搜索结果 - 3
强化学习的双重视角对政策约束的施加
通过使用一种通用的原始对偶框架,将经典优化和控制理论与基于值和演员 - 评论家强化学习方法结合,本研究旨在统一和整合现有技术,并为学习的策略施加附加约束。构建出的 $ exttt {DualCRL}$ 算法支持各种策略约束的组合,在训练过程
→
PDF
2 months ago
快速有限视角光声成像的模型校正学习原始 - 对偶模型
该研究提出了嵌入模型修正的学习原始 - 对偶框架的方法,为光 - acoustic 成像的快速迭代重建提供了可行的模型,实现了实时的可扩展,具有较快推理时间和优异的重建质量。
PDF
a year ago
基于原始对偶框架的去中心化随机优化
本文提出了一种基于原始 - 对偶框架的分布式优化算法,无需使用难以构建的双重随机混合矩阵,通过维护对偶变量来跟踪相邻节点之间的差异,使用这种方法构建的分布式算法比采用梯度跟踪的算法具有更好的性能。
PDF
4 years ago
Prev
Next