语义感知传输调度：基于单调性的深度强化学习方法

May, 2023

语义感知传输调度：基于单调性的深度强化学习方法

Semantic-aware Transmission Scheduling: a Monotonicity-driven Deep Reinforcement Learning Approach

PDF

Jiazheng Chen, Wanchun Liu, Daniel Quevedo, Yonghui Li, Branka Vucetic

TL;DR本文研究了语义感知下的调度问题，利用深度强化学习算法解决大规模系统中的最优策略问题，并通过实验表明，相较于现有算法，所提出的算法能够显著减少训练时间并提高训练性能。

Abstract

For cyber-physical systems in the 6g era, semantic communications connecting →

cyber-physical systems 6g semantic communications deep reinforcement learning distributed devices

发现论文，激发创造

语义通信的性能优化：一种基于注意力机制的强化学习方法

本文提出一种基于语义的通信框架，其中基站从文本数据中提取语义信息并采用知识图表达，将其发给每个用户，用户再采用图到文本生成模型进行还原。为了优化性能，本文提出了一个同时考虑语义精度和完整性的语义相似度度量方法，同时解决了基站资源分配、文本内容和时延约束之间的优化问题。这里采用了基于强化学习的算法，结合了注意力网络来评估语义信息中每个三元组的重要性。

Aug, 2022

基于语义感知的多个马尔可夫源在约束下的远程估计

该研究利用平均成本约束马尔可夫决策过程理论和 Lagrangian 动态规划，探索了在有损且受速率限制的通道上进行多个马尔可夫源的远程估计的语义感知通信；通过使用结构优化结果和开发新的策略搜索算法，可以最小化长期状态依赖成本和估计误差；为了避免马尔可夫决策过程的维度问题，提出了基于 Lyapunov 优化定理的在线低复杂度 Drift-plus-Penalty 调度算法。

Mar, 2024

合作语义通信网络中图像传输的优化

本研究开发了一种语义通信框架用于图像传输；引入多模态度量方法对比提取得到的语义信息与原始图像之间的相关性，以最小化每个服务器的传输延迟同时满足用户 ISS 需求为目标，提出了基于价值分解的最大熵多智能体强化学习算法以解决资源块的分配问题，在模拟实验中将传输延迟降低至传统多智能体强化学习的 16.1%。

Jan, 2023

基于深度强化学习的物联网车联网中的语义感知频谱共享

本文研究了高速移动车联网环境中的语义通信，重点关注车对车和车对基础设施通信之间的频谱共享。我们提出了一种基于深度强化学习软演员 - 评论家算法的语义感知频谱共享算法（SSS），通过优化 V2V 和 V2I 频谱共享的决策来提高语义信息的传输效率和成功率。实验结果表明，SSS 算法在 HSSE 和 SRS 方面的性能优于其他基线算法。

Jun, 2024

语义通信网络的自适应资源分配

我们提出了一种自适应语义资源分配方案，通过语义比特量化（SBQ）与现有无线通信兼容，解决了动态无线环境中由语义度量和传输度量之间的附加映射关系引入的环境感知不准确的问题，并通过联合优化基站的传输波束，语义表示的比特数，子信道分配和带宽资源分配，解决了将整体有效的语义通信服务质量最大化的问题。通过混合深度强化学习（DRL）算法提出了一种智能资源分配方案，在无线通信中能够有效抵抗语义噪声并获得卓越的性能，比几种基准方案提高了 13% 的 SC-QoS 性能。

Dec, 2023

面向意图感知的基于 DRL 的 5G-NR 上行动态调度器

支持工业物联网用户设备（IIoT UEs）根据所需服务质量（QoS）和随机流量到达的问题进行调查，提出了一种基于深度强化学习（DRL）的集中式动态调度器，用于学习如何在可用通信资源之间安排 IIoT UEs 的通信资源，通过图形化的简化方案以实现快速收敛和更好的学习策略，模拟结果证明了所提出的智能调度器在保证 IIoT UEs 的期望意图方面的有效性，并与传统调度方案（如轮询、半静态和启发式方法）以及无冲突和基于竞争的方案相比具有更好的性能，可以最大化成功计算任务的数量。

Mar, 2024

具有任务不知晓的发射机和动态数据的深度学习技术支持的语义通信系统

本文提出了一种新的神经网络语义通信系统，包括语义编码网络和数据适应网络，通过传输学习中的域适应技术实现了针对动态数据环境下的任务不可知的图像传输，实验结果表明该方法在保持高性能的同时也能适应可观测数据集。

Apr, 2022

多智能体强化学习中通信调度的学习

本研究提出了一种名为 SchedNet 的多智能体强化学习框架，其中智能体能够自主学习如何安排通讯、编码消息以及根据接收到的信息选择动作，并在合作通讯与导航以及捕猎等不同应用场景下展示了比其他机制更显著的表现差距，达到 32% 至 43% 的性能优势。

Feb, 2019

结构增强的深度强化学习在最优传输调度中的应用

本文研发了一种结构增强的深度强化学习算法用于最小化远程估计均方误差，实现在多传感器远程估计系统的最优调度，该算法可以比基准算法节省 50％的训练时间并将远程估计均方误差降低 10％至 25％。

Nov, 2022

基于知识辅助的深度强化学习在 5G 调度器设计中的应用：从理论框架到实现

本论文提出了一种基于知识辅助的深度强化学习算法来设计第五代（5G）移动通信网络中的无线调度器，利用理论模型提出了理论的强化学习框架，在线离线相结合的方式实现了知识辅助 DDPG 算法，通过模拟实验和实际测试证明了该方法在收敛时间和 QoS 性能方面都优于现有方案，减少了 30%~50% 的数据包丢失率。

Sep, 2020