Sep, 2022

合作通信的语义时代:通过离线强化学习加速模拟以接近真实

TL;DR提出一种称为 AoS 的信令更新语义新鲜度的度量方式,针对节点更新源和目的地之间的状态更新的最优控制策略进行研究,提出了在线和离线的深度演员 - 评论家算法,离线算法在数据集质量方面表现出强大的鲁棒性。