BriefGPT.xyz
大模型
Ask
alpha
关键词
game-theoretic perspective
搜索结果 - 4
迭代纳什策略优化:通过无悔学习使 LLMs 与一般偏好相一致
本文以游戏理论的角度,探讨了一种基于人类偏好与强化学习的算法,通过采用无懊悔学习,自我对抗的方式逼近纳什平衡策略,从而解决了大规模语言模型对人类反馈的规模性计算问题。实验证明该算法相较于之前的方法在不考虑个体响应的预期胜率的情况下能够取得更
→
PDF
4 days ago
博弈论非学习样本生成器
从博弈论的角度研究无法学习的样本攻击,将其形式化为非零和斯塔克尔伯格博弈,证明了博弈均衡存在并提出了一种新的攻击方法,该方法可以有效地毒害模型并适用于各种场景。
PDF
5 months ago
防御来自公共模型的转移攻击
通过传输攻击和博弈论的视角,在新的威胁模型下提出了一种有效的防御方法,该方法在公共模型和多个数据集上进行了评估,并且在最强的传输攻击下相较于最好的对抗训练模型具有明显优势。
PDF
8 months ago
具有时间变化的几何折扣的马尔可夫决策过程
研究了时间变动折扣率的无限时间段马尔可夫决策过程,以一个博弈论的视角看待每一个时间步骤为一个独立决策者,研究了所得到博弈的次游戏最佳均衡点(SPE)以及相关的算法问题。提出了 SPE 的存在性的构造性证明,证明了计算 SPE 的 EXPTI
→
PDF
a year ago
Prev
Next