离散领域中的淘普通差分应用

Jan, 2024

Applications of Tao General Difference in Discrete Domain

Linmi Tao, Ruiyang Liu, Donglai Tao, Wu Xia, Feilong Ma...

TL;DR数值差异计算在现代数字时代是核心且不可或缺的。Tao 一般差异（TGD）是一种新颖的理论和方法，用于多维空间中离散序列和数组的差异计算。TGD 算子在真实世界应用中展示了卓越的信号处理能力。

Abstract

numerical difference computation is one of the cores and indispensable in the modern digital era. tao general difference (TGD) is a novel theory and approach to difference computation for discrete sequences and a

numerical difference computation tao general difference smoothness property denoise spatio-temporal edge detection

发现论文，激发创造

Tao 通用微分与差分：理论与应用

本文介绍了一种基于有限区间微分的离散信号处理方法，通过对微分方法进行推广并结合卷积，提出了一系列方便实际操作且具有高抗噪性能的差分算子。

May, 2023

Proximal Gradient TD 算法的有限样本分析

本文旨在分析梯度时序差分学习（GTD）算法族的收敛速率，将 GTD 方法制定为原始 - 对偶鞍点目标函数的随机梯度算法，并进行鞍点误差分析以获得其性能的有限样本界限，提出了两种改进的算法，即投影 GTD2 和 GTD2-MP，理论分析结果表明，GTD 算法族在脱离政策学习场景中与现有的 LSTD 方法相当。

Jun, 2020

加速梯度时差学习

本文提出了一种新的 TD 方法家族 ATD 方法，用于在保证数据效率、减少参数灵敏度和渐进无偏的情况下，大幅减少计算和存储的量，其收敛性得到了期望的证明，并在多个基准域和大型工业能源分配域上进行了实验。

Nov, 2016

直接梯度时差学习

提出一种直接解决双重采样问题的方法，通过在逐渐增大的马尔可夫数据流中使用两个样本，该算法在计算上与 Gradient Temporal Difference (GTD) 一样高效，但摆脱了 GTD 的额外权重，而唯一的代价是随着时间的推移，存储空间呈对数增长。

Aug, 2023

近端梯度时序差分学习：具有多项式样本复杂度的稳定强化学习

本文介绍了近端梯度时序差分学习，通过引入原始 - 对偶鞍点目标函数，提供了一种原则性的方式来设计和分析真正的随机梯度时序差分学习算法，并提出了一种名为 GTD2-MP 的加速算法，使用 “镜像映射” 来提高收敛速度并提高了在非现场学习中与现有最小二乘 TD 方法相比的优越性能。

Jun, 2020

一种仅使用一个步长的新渐变 TD 算法：使用 $L$-$λ$ 平滑性进行收敛速率分析

本文介绍了一种名为 Impression GTD 的全新 GTD 算法，通过最小化期望 TD 更新的范数目标实现单时间尺度，并证明该算法的收敛速度至少为 O (1/t)，甚至更快。同时，与现有的 GTD 算法相比，该算法在在线学习和离线学习问题中表现更快，具有比较稳定的步长范围。

Jul, 2023

非线性分布式梯度时序差分学习

提出了分布式渐进时间差分（TD）学习的变体，并设计了新的分布式 GTD2 和分布式 TDC 算法，以及分布式 Greedy-GQ 控制设置算法。证明了分布式 GTD2 和 TDC 算法在一般光滑函数逼近器中的渐近几乎确定性收敛性。

May, 2018

两个时间尺度的离线 TD 学习：对马尔可夫样本的非渐进分析

本文对两时间尺度 TDC 算法在非独立同分布的马尔可夫抽样路径和线性函数逼近下的收敛性进行了非渐近收敛分析，并在此基础上提出了具有分块减小的步长的 TDC 算法，实验结果表明其具有与 TDC 常数步长收敛速度相当的收敛速度，并在减小步长的情况下仍保持与 TDC 相当的精度。

Sep, 2019

卡尔曼时差法

介绍了一个新的近似框架，即卡尔曼时间差异（KTD）框架，用于解决强化学习中估值函数的扩展问题，并提供了解决确定性和随机性马尔可夫决策过程的 KTD 和 XKTD 算法，证明了其收敛性和比现有算法更好的性能。

Jan, 2014

基于梯度差分的压缩域文本定位方法

本文提出一种基于梯度差异的视频和场景图像文本定位方法，包括多级 2D 小波变换、零交叉技术、形态学膨胀等步骤，可检测和定位各种大小、字体和颜色的文本区域。

Feb, 2015