基于强化学习的传感器优化技术

Aug, 2023

Reinforcement Learning Based Sensor Optimization for Bio-markers

Sajal Khandelwal, Pawan Kumar, Syed Azeemuddin

TL;DR通过增强电极设计和指间电容式无线射频传感器的指标宽度等参数的优化，本研究采用了一种新的基于强化学习的二进制粒子群优化方法（RLBPSO），并与蚁群优化（ACO）和其他最先进的方法进行了对比。结果显示，所提出的 RLBPSO 方法在不同频率范围内显示出最佳的优化设计。

Abstract

Radio frequency (RF) biosensors, in particular those based on inter-digitated capacitors (IDCs), are pivotal in areas like biomedical diagnosis, remote sensing, and wireless communication. Despite their advantages of low cost and easy fabrication, their sensitivity can be hindered by d

radio frequency biosensors inter-digitated capacitors sensitivity reinforcement learning optimization

发现论文，激发创造

无线传感器网络强化学习中的能效

本文提出了一种方法，利用强化学习技术，在能源意识系统中连续进行弱训练，从而提高算法性能并节省能源。这种方法通过利用环境中的其他传感器提供弱标签，然后训练出模型。本方法在模拟本地化环境上进行了评估，并在可用的普遍健康数据集上进行了验证，以利用接收信号强度实现真实的住宅本地化。我们展示了该方法实施成本低、需要更少的工作门槛和能够提供随时间增加的性能改进和能源节约。

Nov, 2018

基于强化学习的无波前传感器自适应光学方法：卫星地面激光通信

本文研究了光学卫星通信（OSGC）中的自适应光学系统问题，并提出了使用强化学习（RL）来减小系统的延迟、大小和成本，通过与低成本四分之一光电二极管进行交互来学习控制策略的方案，并开发了一个 AO RL 环境来评估 RL 的性能。实证分析表明，PPO 优于 Soft-Actor-Critic 和 Deep Deterministic Policy Gradient，并且在 250 次训练之后，PPO 收敛到理想 Shack-Hartmann 传感器所能获得的最大奖励的 86％，表明强化学习在无波阵面传感器的 OSGC 中具有潜在的优势。

Mar, 2023

动态、稀疏和部分观测环境中的信息增益传感器控制

本文提出了一种在部分可观察的、动态和稀疏采样环境下进行自主传感器控制的方法，特别是在射频 (RF) 频谱监测方面，采用预测和信息增益奖励的 DAN 强化学习框架，并使用来自 RF 领域有限的样本迭代改进环境模型。通过基于不同复杂度和评估指标的模拟实验，验证了该方法优于基线专家设计控制器且适应非平稳环境的鲁棒性。

Nov, 2022

基于强化学习信息融合的混合室内定位

本文介绍了一种基于强化学习信息融合框架（RL-IFF）的新型解决方案，通过将到达角度（AoA）与 RSSI 基于粒子滤波和 IMU 基于 Dead Reckoning（PDR）框架相结合，旨在解决 Bluetooth Low Energy 在智能城市中室内动态跟踪 / 定位方法的无法靠谱的问题，实验证明其性能优于同类方案。

Oct, 2022

分布式滤波电路的自动设计和优化采用强化学习

提出的自动化方法利用强化学习算法来改善分布式过滤电路（DFCs）的设计，消除了工程师设计经验的依赖，从而显著降低了电路设计的主观性和限制性。实验结果表明，与传统的工程师驱动方法相比，该方法在设计效率和质量上都有明显的改进，特别是在设计复杂或快速演化的 DFCs 时表现出卓越性能。此外，与现有的电路自动化设计技术相比，该方法展现出更高的设计效率，凸显了强化学习在电路设计自动化中的巨大潜力。

Feb, 2024

约束环境物联网感知的智能通信规划与强化学习

通过多智能体强化学习方法，本论文提出在资源受限条件下，为每个传感器找到最优的通信策略，以实现对环境数据进行准确跟踪，同时充分考虑功率和带宽的限制。实验结果表明，该方法能够在未知带宽限制下，平衡数据收集和预测野火蔓延的需求。

Aug, 2023

光子元件设计的强化学习

我们提出了一种新的 fab-in-the-loop 强化学习算法，用于设计考虑纳米制造过程中的不完美之处的纳米光子元件。通过将该算法应用于单刻蚀平台上制造的 220nm 硅绝缘体（SOI）光子晶体光栅耦合器（PhCGC）的设计，该算法将插入损耗从 8.8 dB 降低到 3.24 dB。使用我们的 fab-in-the-loop 算法产生的最宽带宽设计能够在其最低点处以少于 10.2 dB 的损耗覆盖 150 nm 的带宽。

Jul, 2023

利用强化学习进行 IR 感知的 ECO 时序优化

工程变更订单（ECOs）通过集成 IR-drop 感知时序分析和强化学习（RL）优化方法，在物理设计和功率网格综合后通过门尺寸调整来修复由 IR-drop 引起的时序退化，以保持时序改进的性能，具有良好的可迁移性。

Feb, 2024

一比特 ADC MIMO 系统的鲁棒数据检测：一种强化学习方法

本文提出了一种强化学习的可能性函数学习方法，用于在一个比特模拟数字转换器（ADC）下通过多输入多输出（MIMO）系统实现优化的数据检测。该方法旨在利用从数据检测中获得的输入输出信号样本来补偿可能性函数中的模型偏差，同时使用马尔可夫决策过程（MDP）最大化学习的可能性函数的准确性。模拟结果表明，该方法在可能性函数中存在模型偏差的优化数据检测方法中提供了显著的性能增益。

Mar, 2019

基于强化学习优化的图像异常检测中的电池驱动 TinyML 系统模拟

通过使用强化学习算法优化系统操作和云异常处理，TinyML 启用的物联网系统在性能优化方面获得了较好的结果，相对于静态和动态优化方法分别提高了 22.86％和 10.86％的电池寿命。

Mar, 2024