ViWi: 用于视觉辅助无线通信的深度学习数据集框架

Nov, 2019

ViWi: 用于视觉辅助无线通信的深度学习数据集框架

ViWi: A Deep Learning Dataset Framework for Vision-Aided Wireless Communications

Muhammad Alrabeiah, Andrew Hredzak, Zhenhao Liu, Ahmed Alkhateeb

TL;DR本文介绍了一种利用 3D 建模和射线跟踪软件生成高保真合成无线电和视觉数据样本的 Vision-Wireless 数据集框架。该框架旨在为新的机器学习算法提供一种生成训练和测试数据集的方式，并帮助评估不同算法的质量。

Abstract

The growing role that artificial intelligence and specifically machine learning is playing in shaping the future of wireless communications has opened up many new and intriguing research directions. This paper motivates the research in the novel direction of \textit{vision-aided wirele

artificial intelligence machine learning vision-aided wireless communications dataset framework 3d-modeling

发现论文，激发创造

Berlin V2X: 多车和多无线电接入技术的机器学习数据集

通过一系列的详细的测量活动，我们提供了一批适用于车联网 (V2X) 领域的、具有高时间分辨率的 GPS 定位的无线测量数据集，并公开了这些数据，供新研究人员使用。这些数据可用于针对 6G 及以后的无线通信技术的机器学习研究和新的车联网和工业通信用例的探索，并建议 ML 需要克服的一些挑战和利用的一些功能。}

Dec, 2022

无线通信与计算机视觉在 5G 以后的应用

介绍了一种新兴的计算机视觉和无线通信交叉的范例，利用机器学习和非射频数据，展示了计算机视觉如何增强视觉辅助的无线网络，提高可靠性且不损失频谱效率，同时指出 RF 感应和成像在鲁棒性方面的作用，并探讨了将 RF 和非 RF 模态融合来实现超可靠通信和智能 6G 网络所需的重要性。

Oct, 2020

走向 AI 支持下的联网产业：AGV 通讯与传感器测量数据集

该研究呈现了两个在工业测试平台上进行的无线测量活动，重点是工业车辆之间的侧链通信场景以及用于自主清洁机器人的专用蜂窝网络。两个数据集的详细信息提供，并针对快速应用设计了标签和预过滤，以便为机器学习等任务提供洞见。

Dec, 2022

6G 无线通信中的感知与视觉技术角色

介绍了一种基于感知和计算机视觉技术的无线通信框架，通过对高分辨率感知信息的分析，能够快速准确地理解无线环境并执行无线任务，在 6G 通信场景中取得了显著的性能提升。

May, 2024

DeepSense-V2V: 一种车辆之间的多模式感知、定位和通信数据集

该研究提出了第一个大规模的多模态数据集，用于研究毫米波车到车通信。数据集包括来自 360 度摄像机、四个雷达、四个 60 GHz 相控阵、一个 3D 激光雷达和两个精确 GPS 的两车试验台的数据。该数据集涵盖了日间和夜间的城际和乡村地区，行驶距离 120 公里，速度高达 100 公里 / 小时。数据集包含了超过一百万个物体的检测结果，从卡车到自行车都有。该研究还提供了详细的数据集统计信息，证明了各种情况的覆盖情况，并强调了该数据集如何支持新颖的机器学习应用。

Jun, 2024

AI 助力的 WiFi 室内成像革命

WiFi 作为无处不在的信号是进行室内成像和同步最新信息给所有连接设备的一个有前景的选择。该研究工作首次将 WiFi 室内成像视为一个多模式图像生成任务，将测量得到的 WiFi 功率转换为高分辨率的室内图像。我们提出的 WiFi-GEN 网络实现的形状重构准确性是物理模型反演方法的 275％，此外，Frechet Inception Distance 得分减少了 82％。为了检验模型在这个任务中的有效性，我们发布了第一个大规模数据集，其中包含了 8 万对 WiFi 信号和成像目标。我们的模型将非线性、病态以及不确定性等挑战吸收到我们的生成 AI 网络的大量参数中，并且还设计了最佳拟合测得的 WiFi 信号和所需的成像输出。为了可复现性，我们将在接受后发布数据和代码。

Jan, 2024

WebVision 数据库：从网络数据中进行视觉学习和理解

本研究基于收集自网络的大规模嘈杂数据对学习视觉识别模型进行了探究。我们构建了一个名为 WebVision 的新数据库，其中包含了超过 240 万张与 ILSVRC 2012 基准数据集的 1,000 个语义概念相关的查询生成的网络图像，并收集了元信息（例如标题，描述，标签等）。通过这个数据库，我们发现网络图像可以用于训练良好的深度 CNN 模型，且该模型的泛化能力甚至优于 ILSVRC 2012 数据集训练的模型。此外，我们也发现了一个数据集偏见问题，即在视觉领域自适应方面存在一些问题。这个新的 WebVision 数据库及其相关研究对于利用网络数据最小化监督学习最先进的视觉模型具有重要的价值。

Aug, 2017

基于深度学习的穿戴式助视系统

本文提出了一种基于深度学习的辅助系统，旨在提高视障人士的环境感知体验，通过 RGBD 数据和建立的语义地图预测行走指令、进行障碍物避让，在多种情境下得到了很好的实验效果并有效提高了视障人士的环境感知体验。

Aug, 2019

机器学习与大数据的结合：无线通信视角

本文简要介绍大数据分析和机器学习，并探讨它们在下一代无线网络中的潜在应用。提出了一个统一的大数据辅助的机器学习框架，用于预测移动用户的要求，并利用它来改善社交网络感知无线网络的性能，为了描述该框架的效率，提供了一对智能实际应用作为案例研究，以及为激励未来的研究提供开放式研究机会。

Jan, 2019

使用合成数据的视觉和语言模型超越名词

本文旨在通过提供一百万级的、人工合成的图像数据集 SyViC 和相应的数据生成代码，以及细调模型的策略，探讨如何提高视觉语言模型对非物体类词汇等方面（即超越名词的视觉语言概念）的理解和组合推理能力，从而在保持零样本准确度的前提下，极大提高模型的性能。通过在 ARO 和 VL-Checklist 等基准测试上的广泛实验和削减，我们证明了用人工合成数据进行训练可以在不牺牲零样本能力的情况下大幅提升其 VLC 理解能力（如在 ARO 上提高 9.9％，VL-Checklist 上提高 4.3％）。

Mar, 2023