Nov, 2023

线性扰动损失最小化的探索

TL;DR使用线性损失扰动(EVILL)引入一种随机探索方法,针对结构化随机赌博问题,通过求解线性扰动正则化负对数似然函数的最小化器来进行探索,从而在理论和实践中证明了EVILL与类似于汤普森采样风格的参数扰动方法的性能相匹配,还介绍了概括线性赌博问题以外的一个示例,表明PERT导致的不一致估计以及线性遗憾,而EVILL仍然表现出色,与PHE相同,EVILL可以用几行代码实现。