Jul, 2018

Tsallis-INF:用于随机和对抗赌徒的最优算法

TL;DR通过在线镜像下降(OMD)算法与 Tsallis 熵正则化之间的结合,本论文提出了一种能够同时在对抗场景与随机场景下带来最优伪后悔值的算法,其具有自限制约束下的对抗场景、随机有界对抗场景以及受敌方攻击污染的随机场景等多种通用性,且能在这些场景下同时保证对抗后悔保证和对数后悔保证;该算法同时能够实现证券交易中的对抗最优化和随机最优化,并且在实际测试中表现出了极高的鲁棒性和性能优势。