BriefGPT.xyz
大模型
Ask
alpha
关键词
population-based optimization
搜索结果 - 2
重新思考基于群体协助的离线策略强化学习
本文深入研究了结合 off-policy reinforcement learning 和 population-based optimization 两种算法的训练方法,在机器人运动任务中的实验结果表明 population data 的
→
PDF
a year ago
AAAI
在硬标签黑盒设置中生成自然语言攻击
该研究提出了一种决策式的攻击策略,利用基于人口统计的优化算法,通过仅观察目标模型预测的前一标签,制作出可信且语义相似的对抗性例子。与先前文献中提出的攻击相比,在高度限制的情况下,成功率更高,被替换单词比例更低。
PDF
4 years ago
Prev
Next