BriefGPT.xyz
Ask
alpha
关键词
entropy optimization
搜索结果 - 3
利用预训练技能来拓展目标勘探,用于稀疏奖励长时间尺度的目标条件加强学习
本文提出了一种新的学习目标,通过优化已实现和未来需要探索的目标的熵,以更高效地探索子目标选择基于 GCRL,该方法可以显著提高现有技术的探索效率并改善或保持它们的表现。
PDF
2 years ago
ICCV
SENTRY: 无监督域适应的选择性熵优化通过委员会一致性
提出了一种基于自我训练和预测一致性的无监督域自适应算法(SENTRY),它利用随机图像变换的委员会评估目标实例的可靠性,通过增加高度一致性目标实例的置信度,减少高度不一致实例的置信度来选择性地最小化预测熵和最大化预测熵。该算法结合了基于伪标
→
PDF
4 years ago
自监督的通用领域适应
该论文提出了一种更具普适性的领域自适应框架,称为通过熵优化的领域自适应邻域聚类(DANCE),可以处理任意类别转移。DANCE 结合两个新颖的想法:第一,我们提出了一种新的邻域聚类技术,在无监督的情况下学习目标域的结构。第二,我们利用基于熵
→
PDF
4 years ago
Prev
Next