从地图生成地标导航指南的图文问题

ACLDec, 2020

从地图生成地标导航指南的图文问题

Generating Landmark Navigation Instructions from Maps as a Graph-to-Text Problem

Raphael Schumann, Stefan Riezler

TL;DR本文提出了一种基于神经模型和 OpenStreetMap 数据的人工导航模型，能够生成包含物理地标的自然语言导航指令，评估表明该模型的导航指令具备与人类指令类似的特征，可成功指引行人在 Street View 进行导航。

Abstract

Car-focused navigation services are based on turns and distances of named streets, whereas navigation instructions naturally used by humans are centered around physical objects called →

navigation landmarks openstreetmap neural model human natural language

发现论文，激发创造

使用一种全能神经模型进行一遍式多形式和基础语音系统压缩与量化

我们提出了一种新颖的一次性多个 ASR 系统联合压缩和量化方法，使用一个全能模型。一个单独的压缩周期允许同时构建具有不同编码器深度、宽度和量化精度设置的多个嵌套系统，而无需单独训练和存储个别目标系统。实验证明，与等复杂度的单独训练系统相比，一个全能模型中压缩的多个 ASR 系统的字错误率（WER）相当，或更低至 1.01％绝对值（6.98％相对值）。整体系统压缩和训练时间加速了 3.4 倍。在基线 Switchboard-300hr Conformer 和 LibriSpeech-100hr fine-tuned wav2vec2.0 模型上，最大模型大小压缩比分别达到了 12.8 倍和 3.93 倍，没有引起统计上显著的 WER 增加。

Jun, 2024

BvSP: 广视野软启发式训练用于少样本情感四元预测

本研究旨在解决使用神经模型进行少样本学习中，纬度预测的挑战，并提出了一种聚合多个模板的广角软提示方法，通过使用预训练语言模型选择相关度最高的 k 个模板，并使用软提示来指导预训练语言模型，最终将多个模板的结果通过投票机制进行聚合。实验证明，该方法在各项指标上明显优于其他最新方法和公共数据集。

Jun, 2024

GenS：多视角图像的通用神经表面重建

我们提出了 GenS，一个端到端的通用神经表面重建模型，可以通过结合有符号距离函数（SDF）和可微体渲染，将多视图图像无需 3D 监督进行表面重建。与现有解决方案相比，我们的表示更强大，能够恢复高频细节并同时保持全局平滑性。同时，我们引入多尺度特征度量一致性，以在更具区分性的多尺度特征空间中施加多视图一致性，从而抵抗光度一致性的失效。我们还设计了一种视角对比损失，通过将密集输入中的几何先验精炼到稀疏输入中，强制模型对少视角覆盖的区域具有鲁棒性。在流行的基准测试上进行的大量实验证明，我们的模型能够很好地推广到新场景，并且胜过现有的最先进方法，即使那些使用地面真实深度监督的方法。

Jun, 2024

演化跟踪对比学习和无关词排除在链式自由时尚中建模动态主题

提出了一种新的神经模型来解决现有动态主题模型中的重复主题和不相关主题问题，并通过引入新的进化跟踪对比学习方法和不相关词排除方法来提高主题进化的质量和多样性。

May, 2024

基于 OpenStreetMap 和 H3 网格的全球规模时空知识图谱

基于开放街道地图 (OpenStreetMap) 数据，我们提出了一个支持全球范围的 OpenStreetMap 数据转化成时空知识图谱的框架，同时利用 Apache Sedona 作为计算框架来构建该图谱。

May, 2024

图像目标导航的变形金刚

利用生成式 Transformer 模型，通过联合建模图像目标、摄像头观察和机器人过去的动作来预测未来的动作，从而实现对于长时间跨度的图像目标导航任务的稳健的、无需与环境实时交互的目标导向导航策略。

May, 2024

OpenBot-Fleet: 实际机器人的集体学习系统

OpenBot-Fleet 是一个开源的云机器人系统，利用智能手机感知、本地计算和通信，Google Firebase 进行安全的云存储和离线计算，以及强大且低成本的轮式机器人在真实环境中执行任务，并在云中学习导航策略，实验表明 OpenBot-Fleet 可在各种未知环境下成功导航，是云机器人领域的重要进展。

May, 2024

昆虫启发机器人导航中的家庭向量方向的直接学习

通过学习飞行、视觉感知和卷积神经网络，我们提出了一种机器人导航方法，可以学习家向量的方向并成功地回家。

May, 2024

组合神经材质

使用组合神经模型全自动地表示纹理，通过编辑高斯文本在潜在空间中修改纹理，实现了纹理分析、建模和编辑的新技术，拓展了可控纹理的视觉吸引力图像的创作可能性。

Apr, 2024

傅里叶增强的多模式 3D 小物体光学标记识别和穿刺手术导航定位方法

这篇论文提出了一种新的三维小物体医疗标记检测方法，通过识别小型单环的中心作为针穿入点，基于峰值变换增强技术为数据集进行增强，提取特征图的 ROI 生成掩模图，并通过 ROI 点云轮廓拟合的方式获取深度图中 ROI 的点云，最后通过 Tukey 损失优化方法实现高精度和高稳定性定位以及任意针穿入点的定位。

Apr, 2024