- 应用自适应主动曝光控制技术改善现场视觉基准标志的感知
准确的本地化对于自主水下载具(AUVs)进行精确任务非常重要,而对于水下恶劣的照明条件,使用基于视觉标记的基于图像梯度的主动摄像机曝光控制方法可以显著提高机器人定位的准确性。
- 概念诱导:使用 LLooM 对非结构化文本进行高级概念分析
我们引入概念归纳,一种从非结构化文本中提取明确纳入标准的高级概念的计算过程,该过程通过使用大型语言模型不断合成抽样文本并提出具有不断广泛性的可解释概念。我们在具有毒性的在线评论数据集上实例化了 LLooM,并通过技术评估和四个分析场景的研究 - EVIT: 面向事件推理的事件导向指令调整
本文提出了一种名为事件导向指导调整(EvIT)的方法来训练我们的大型语言模型,通过引入事件四元组及相应的关系学习,结合启发式的无监督方法从大规模语料库中挖掘事件四元组,从而更好地激发模型的事件推理能力,并在多个数据集上进行广泛的实验验证,自 - COLING通过图融合增强语言模型对抗变异攻击的鲁棒性
通过引入中文字符变异图,本研究提出了一种新方法 CHANGE,以增强预训练语言模型对中文字符变异攻击的鲁棒性,在多个自然语言处理任务中的实验表明 CHANGE 在对抗攻击方面优于现有的语言模型,为鲁棒性语言模型研究做出了宝贵的贡献,并凸显了 - 可解释多目标跟踪的反向神经渲染
通过在预训练的 3D 对象表示的潜在空间上优化可微分的渲染管道,我们提出将 RGB 摄像机中的 3D 多目标跟踪重新构建为逆渲染问题,通过优化图像损失在生成的潜空间上进行,其固有地解藕形状和外观属性。我们验证了我们方法的泛化和扩展能力,通过 - MLS-Track:RMOT 中的多层语义交互
通过使用 Unreal Engine 5 构建了一个名为 Refer-UE-City 的全新基准数据集,其中包括了交叉口监控视频中的人和车的外观和行为细节,并提出了一种多层语义引导的多目标追踪框架 MLS-Track,通过引入语义引导模块 - LongEmbed:扩展嵌入模型以用于长上下文检索
现代自然语言处理(NLP)应用中的嵌入模型在信息检索和大规模生成方面起着重要作用,本文探索了现有嵌入模型的上下文窗口扩展,将限制提升到 32k,而不需要额外的训练。我们通过新构建的 LongEmbed 基准测试,对目前的嵌入模型在长文本检索 - FreeDiff: 基于扩散模型的图像编辑的递进频率截断
通过频率截断的方法,我们提出了一种新颖的 fine-tuning 自由方法用于改善扩散模型的引导,从而实现了在各种编辑任务和不同图像集上与最先进方法相媲美的结果,突显了它在图像编辑应用中的多功能潜力。
- 多视图图结构表示学习:基于图粗化
通过实验分析,我们探索将图结构作为整体像节点一样进行学习的可行性,并基于我们的发现,提出了一种基于图粗化的多视图图结构表示学习模型(MSLgo)来进行图分类。我们通过层次启发式图粗化压缩循环和团,并通过精心设计的约束进行限制,从而构建了粗化 - 我们能捉住大象吗?自然语言生成中幻觉评估的演变:综述
自然语言生成(NLG)中的幻觉就像房间里的大象,明显却经常被忽视,直到最近取得了显著进展,提高了生成文本的流畅性和语法准确性。对于大型语言模型(LLMs),幻觉可能在各种下游任务和随意对话中发生,需要准确评估以提高可靠性和安全性。然而,目前 - 大型语言模型在目标情感分析中的应用
本文研究使用基于解码器的生成式 Transformer 来提取对俄罗斯新闻文章中的命名实体的情感分析能力,通过对 RuSentNE-2023 数据集进行实验,发现在无监督和有监督转换器中,零 - shot 方法的结果与以 BERT-base - 无需伴随求解器的混沌流动的伴随灵敏度:一种数据驱动方法
通过使用数据驱动的策略,利用参数感知回声状态网络(ESN)和其伴随版本计算系统参数的敏感性,从而不需要特定于代码的伴随求解器。
- 推荐模型如何加剧流行偏见:光谱视角的分析
推荐系统存在流行度偏差问题,本研究深入研究了流行度偏差放大的原因,并提出一种使用主奇异向量的导数来缓解这种偏差的新方法,通过对主奇异值的大小施加惩罚,验证了该方法在七个真实数据集和三个测试场景下的卓越性能。
- 利用联合雨滴和细节感知表示消除复杂降雨
通过上下文为基础的实例级调制和对比学习,提出了一种用于训练混合数据集模型的创新算法 CoIC,以提高卷积神经网络和 Transformer 模型的去雨能力。
- 通过效率视角进行语言模型的规划
对使用 LLMs 进行规划的成本进行分析,指出最近的趋势极其不经济。我们提出了一种更高效的方法,并呼吁研究团体探索维持效率的基于 LLMs 的方法的负责任使用计算资源。
- 通过概率上升实现通用批次贝叶斯优化的正交方法
在贝叶斯优化中并行化是一个常见的策略,但面临几个挑战:在获取函数和内核选择方面需要灵活性,同时处理离散和连续变量的灵活性,模型错误指定以及快速大规模并行化。为了解决这些挑战,我们介绍了一个灵活和模块化的基于概率提升和内核数值积分的批量贝叶斯 - 基于稳定性信息的贝叶斯优化用于 MPC 成本函数学习
设计预测控制器以实现闭环性能最优化,同时保持安全和稳定性是具有挑战性的。本文通过在考虑闭环稳定性的情况下,利用受限贝叶斯优化来学习预测控制参数,将成本函数参数化为前馈神经网络,并进行闭环行为和模型 - 过程不匹配的最小化,从而提供了高自由度 - TriForce:层次化猜测解码对长序列生成实现无损加速
通过介绍 TriForce,提供了一种可扩展到长序列生成的分层推断系统,该系统通过检索作为初稿模型使用的原始模型权重和动态稀疏键值缓存来降低起草延迟,并在层次结构中进一步被较小的模型推测,以实现卓越的加速和处理能力。
- SPOT:基于点云的立体视觉地点识别(适用于类似和对立视点)
通過立體視覺測距法估計結構,並利用新的雙重距離矩陣序列匹配方法,提出了在有限視野下進行對立觀點的視覺地點識別方法,並在公開數據集上進行了評估,證明了其在對立觀點情況下相對其他方法具有顯著的改進,同時在類似觀點情況下也表現出競爭性能。
- 去偏分布压缩
现代压缩方法可以比独立同分布采样更简洁地概括目标分布 P,但需要访问低偏差输入序列,例如迅速收敛到 P 的马尔可夫链。我们介绍了一套适用于带偏差输入序列压缩的新型压缩方法。在给定 n 个针对错误分布的点和二次时间的情况下,Stein Ker