- 针对口语对话理解数据的低成本 LLM 注释研究
自动增强口语对话语料库中的语义表示的研究,评估了大型语言模型微调的相关性、生成注释所捕捉的知识,以及半自动注释的影响。
- LetsMap:无监督语义 BEV 地图的表示学习
该研究提出了一种无监督学习方法,从单眼正视图像生成语义鸟瞰地图,以在自动驾驶的各种决策任务中提供强大的遮挡推理能力,其使用了 1% 的标注数据和无额外标记数据,在 KITTI-360 和 nuScenes 数据集上表现与现有最先进的方法相当 - ParamReL: 通过渐进式编码贝叶斯流网络学习参数空间表示
使用参数空间中的自编码器学习参数的潜在语义并与 BFNs 集成,以学习参数表征并展示渐进结构,同时通过互信息项促进潜在语义的解耦并捕捉有意义的语义,具备优越的学习参数表示的效果。
- 提高问答中的 LLM 准确性:本体论拯救!
使用知识图谱和语义表示的大型语言模型(LLMs)相较于直接对 SQL 数据库(即 Text-to-SQL)回答问题的系统,可以提高准确性,并且研究表明,通过使用知识图谱,准确性提升了从 16% 到 54%。本研究基于此,提出了一个方法来进一 - 在线行为表示:变化检测与符号编程
该论文提出了一种在线行动表示方法,利用变化检测算法自动分割行动序列,并根据关节角和骨骼长度序列通过分段线性拟合算法确定各段的起始时间和结束时间,以获得更高级的语义表示。该方法在重复计数任务中比现有方法表现更好或相当,同时能够在线进行计数。
- 基于语义的异构数据集成分布式中间件的开发及其在干旱应用中的应用
发展基于语义的数据集成中间件,将当地土著知识和传感器数据的异构数据模型融合,以实现准确的旱灾预测系统。土著知识通过中间件的自动推理生成模块转化为规则,与传感器数据结合进行推理,确定旱灾的发生。语义中间件包括分布式架构、实时流处理引擎、基于规 - 选择查询包作为信息寻求对话中的伪相关反馈
本论文提出了一种 Query-bag 基于伪相关反馈的框架(QB-PRF),通过构建与查询相关的查询包作为伪信号来指导信息检索对话,采用对比学习训练无监督方式中的同义查询选择模块(QBS),通过多维注意力计算融合同义查询的查询包融合模块(Q - 国际象棋对弈语言模型中的紧急世界模型与潜变量估计
迄今为止,语言模型的出色表现引发了对其性能来源的争议,是仅仅学习句法模式和表面统计的结果,还是从文本中提取了语义和世界模型?本研究在国际象棋这一更复杂的领域中扩展了之前的工作,通过在真实比赛中进行训练并使用线性探测和对比激活来研究模型的内部 - StrokeNUWA: 笔画分词用于矢量图形合成
使用矢量图像进行视觉综合可以提高语义表示的真实性,本文引入 StrokeNUWA 作为一种更好的视觉表示,通过矢量图像上的 “笔画标记” 实现了高度压缩,提高了速度,并在向量图形生成任务中明显优于传统的 LLMs 和基于优化的方法。
- 基于语义概念嵌入的文本相似度估计
通过结合传统词嵌入和语义概念嵌入,基于多网语义网络形式化提出的语义概念嵌入(CE)能够提高预测目标群体的准确性。
- WEBDial,一种多领域、多任务的统计对话框架与 RDF
WEBDial 是一个对话框架,它采用 RDF 三元组而非槽值对的图形形式进行语义表示,具有应用广泛性和可扩展性,适用于简单到复杂的应用。
- 基于稳健 DINO 特征的多任务图像修复
我们引入 DINO-IR,一种新颖的多任务图像修复方法,利用从 DINOv2 提取的稳健特征,通过使用浅层特征捕捉低级图像特征、深层特征保证鲁棒语义表征且不敏感于退化、并使用专门的组件进行特征集成,包括多层语义融合模块、DINO-Resto - 人物再识别的全局和组件化的语义表示自监督学习
通过使用交互式分割模型(ISM)进行自适应的基于部位的语义提取,本文提出了 SemReID,一种自我监督的 ReID 模型,通过技术手段(如图像遮罩和 KoLeo 正则化)改进其语义表示,证明了其在三种类型的 ReID 数据集上具有优越的性 - 基于交互矩阵的对比式提示学习代码检索
CPLCS 是一种基于交互式跨模态学习对比提示的代码搜索方法,通过学习 PL 和 NL 表示之间的语义匹配关系、使用双编码器结构的提示学习设计来改善语义表征问题,并使用交互式跨模态学习机制增强 NL 和 PL 之间的精细映射,实验结果在六种 - HuBERTopic: 通过主题模型自我监督提升 HuBERT 的语义表示
我们提出了一种新方法来丰富 HuBERT 的语义表示,通过将主题模型应用于伪标签以为每个话语生成主题标签,并使用主题标签作为教师添加辅助的主题分类任务,以无监督的方式融入额外的全局语义信息。实验证明,我们的方法在大多数任务中实现了与基准方法 - 广泛可解释的语义表示:用于更广泛适用性的无框架意义表示
本文提出了一种新的语义表示方法 WISeR,突破了抽象意义表示 (AMR) 的挑战。我们将 AMR 谓词的编号参数转换为不需要引用语义框架的主题角色,创建了一个新的包含 1K 个英语对话句子的 WISeR 和 AMR 注释语料库,并训练了一 - ICCV迭代原型的手语翻译
该论文介绍了 IP-SLT,这是一个简单而有效的手语翻译框架,通过迭代改善方式,增强了输入手语视频的语义表达(原型)。通过特征提取、原型初始化和迭代原型改进,IP-SLT 能够准确理解手语,并将其流畅和恰当地翻译成文本。
- 代理人、系统和服务集成本体论:OASIS 2 版本
本文介绍了 OASIS 本体论在多智能体系统中的应用。通过一个基于行为主义视角的方法,本文阐述了 OASIS 本体论的主要建模方法,讨论了该本体论的最新版本 OASIS 2 的特点及其在区块链等领域中的应用。
- 使用文本图像扩散模型提升人 - 物交互检测
本文提出了一种新的 HOI 检测方案 DiffHOI,通过预先训练的文本 - 图像扩散模型增强了检测器的性能,进一步减少了对交互预测的歧义,并通过 SynHOI 数据集有效缓解现有数据集中的长尾问题,促进了交互表示的学习。
- ACLRetroMAE-2: 双工遮蔽自编码器用于预训练面向检索的语言模型
本文提出了一种新的预训练方法,名为 Duplex Masked Auto-Encoder(DupMAE),以改善用于信息检索任务的上下文嵌入的语义表示质量,其中所有上下文嵌入都可以被利用。通过两个互补的自编码任务,联合训练一个统一的编码器,