从地图生成地标导航指南的图文问题
我们提出了一种新颖的一次性多个 ASR 系统联合压缩和量化方法,使用一个全能模型。一个单独的压缩周期允许同时构建具有不同编码器深度、宽度和量化精度设置的多个嵌套系统,而无需单独训练和存储个别目标系统。实验证明,与等复杂度的单独训练系统相比,一个全能模型中压缩的多个 ASR 系统的字错误率(WER)相当,或更低至 1.01%绝对值(6.98%相对值)。整体系统压缩和训练时间加速了 3.4 倍。在基线 Switchboard-300hr Conformer 和 LibriSpeech-100hr fine-tuned wav2vec2.0 模型上,最大模型大小压缩比分别达到了 12.8 倍和 3.93 倍,没有引起统计上显著的 WER 增加。
Jun, 2024
本研究旨在解决使用神经模型进行少样本学习中,纬度预测的挑战,并提出了一种聚合多个模板的广角软提示方法,通过使用预训练语言模型选择相关度最高的 k 个模板,并使用软提示来指导预训练语言模型,最终将多个模板的结果通过投票机制进行聚合。实验证明,该方法在各项指标上明显优于其他最新方法和公共数据集。
Jun, 2024
我们提出了 GenS,一个端到端的通用神经表面重建模型,可以通过结合有符号距离函数(SDF)和可微体渲染,将多视图图像无需 3D 监督进行表面重建。与现有解决方案相比,我们的表示更强大,能够恢复高频细节并同时保持全局平滑性。同时,我们引入多尺度特征度量一致性,以在更具区分性的多尺度特征空间中施加多视图一致性,从而抵抗光度一致性的失效。我们还设计了一种视角对比损失,通过将密集输入中的几何先验精炼到稀疏输入中,强制模型对少视角覆盖的区域具有鲁棒性。在流行的基准测试上进行的大量实验证明,我们的模型能够很好地推广到新场景,并且胜过现有的最先进方法,即使那些使用地面真实深度监督的方法。
Jun, 2024
提出了一种新的神经模型来解决现有动态主题模型中的重复主题和不相关主题问题,并通过引入新的进化跟踪对比学习方法和不相关词排除方法来提高主题进化的质量和多样性。
May, 2024
基于开放街道地图 (OpenStreetMap) 数据,我们提出了一个支持全球范围的 OpenStreetMap 数据转化成时空知识图谱的框架,同时利用 Apache Sedona 作为计算框架来构建该图谱。
May, 2024
利用生成式 Transformer 模型,通过联合建模图像目标、摄像头观察和机器人过去的动作来预测未来的动作,从而实现对于长时间跨度的图像目标导航任务的稳健的、无需与环境实时交互的目标导向导航策略。
May, 2024
OpenBot-Fleet 是一个开源的云机器人系统,利用智能手机感知、本地计算和通信,Google Firebase 进行安全的云存储和离线计算,以及强大且低成本的轮式机器人在真实环境中执行任务,并在云中学习导航策略,实验表明 OpenBot-Fleet 可在各种未知环境下成功导航,是云机器人领域的重要进展。
May, 2024
这篇论文提出了一种新的三维小物体医疗标记检测方法,通过识别小型单环的中心作为针穿入点,基于峰值变换增强技术为数据集进行增强,提取特征图的 ROI 生成掩模图,并通过 ROI 点云轮廓拟合的方式获取深度图中 ROI 的点云,最后通过 Tukey 损失优化方法实现高精度和高稳定性定位以及任意针穿入点的定位。
Apr, 2024