BriefGPT.xyz
大模型
Ask
alpha
关键词
sac
搜索结果 - 4
SARC:软性演员回顾评论家
本文提出了软演员回溯评论家(SARC)算法,通过增加回溯损失项来改进 SAC 的评论家学习,从而提高政策梯度估计和实现更好的策略,在基准环境中展示了 SARC 对 SAC 的持续改进表现。
PDF
a year ago
基于块的开放信息性提取
本研究提出了一种名为 SaC(Sentence as Chunk sequence)的新方法用于 Open Information Extraction(OIE)任务中的元组抽取,并使用基于 BERT 的简单模型 Chunk-OIE,在多个
→
PDF
a year ago
机器人控制的 DRL 过程中的部分可观测性
本文研究了 Deep Reinforcement Learning 在机器人控制任务中的应用,特别是在部分可观性条件下,比较了 TD3、SAC 和 PPO 算法的表现,并提出了改进部分可观性下 TD3 和 SAC 算法鲁棒性的多步版本算法。
PDF
2 years ago
图神经推荐的空间自回归编码
本文提出了一种名为 SAC 的新型框架,它采用了一种新的空间自回归范式来充分利用邻居的接近性和高阶信息,同时还提出了邻居信息瓶颈来学习目标节点到邻居的预测任务的最小充分表示,并消除邻居的冗余,实验结果表明,在公共推荐数据集和某真实情境下的大
→
PDF
2 years ago
Prev
Next