- 多模态数据和资源高效的设备导向语音检测与大型基础模型
通过消除触发短语的需要,本研究探索了使用流式音频录制的设备麦克风记录的信号来确定用户是否在与虚拟助手进行交流,通过将语音识别系统的最佳假设和解码器信号与音频编码器的声学表示结合为大型语言模型的输入特征来实现这一目标。使用低秩适应和前缀调整的 - 对话中的主题和体裁
本文主张话题在对话中起着基础性作用,与体裁概念相辅相成,需要进行分离和正交定义。该论点有助于构建模块化、可靠和可控制的灵活领域对话系统。
- 学习大脑区域之间的高阶关系
从功能性磁共振成像(fMRI)信号中发现可靠且信息丰富的脑区之间的相互作用对认知的神经科学预测至关重要。然而,大多数现有方法无法准确地表征这些相互作用,因为它们仅关注成对连接并忽视脑区的高阶关系。为了解决这个问题,该研究提出了一种名为 Hy - AI 中的(非)理性:现状、研究挑战与待解之问
人工智能中理性的概念至关重要,但没有一个统一的定义来界定何为理性代理。本文调查了人工智能中的理性与非理性,并阐述了这一领域的问题。研究经济学、哲学和心理学等其他领域对理性的理解对其在人工智能中的观念产生了影响。从人工智能代理的行为出发,我们 - 城市环境中安全互动自主驾驶的想象增强分层强化学习方法
通过引入想象增强的分层强化学习算法,我们设计了一种新的导航算法,使得智能体能够在真实世界的导航任务中学习安全和交互的行为,提高了成功率并减少了平均步骤的数量。
- 多模态交互专家混合
多模态机器学习在理解图像和描述性文本之间的关系方面取得了重要进展,但这仅仅是潜在多模态交互的一部分,在预测讽刺等新交互中未包括新的冲突话语和手势之间的交互。本文通过一种称为 MMOE 的新方法解决了这个问题,该方法通过每种具体交互类型使用专 - 鼓励可推导行为的自主性:带观察信息的重复双矩阵斯塔克伯格博弈
当与其他非竞争决策代理交互时,自主代理的行为必须是可推测的,以便传达其意图和策略。本文使用具有观测的重复双矩阵斯塔克尔伯格博弈模型推断性问题,其中领导者和追随者反复互动,并通过观察动态反应。我们展示了可推测性损失的上界,该上界取决于互动次数 - 通过自然语言指导的语义探索提高深度强化学习的效率
用检索式方法通过神经网络编码,选择性、高效地与 oracle 进行交互,并使用 oracle 的答案更新 agent 的策略和值函数,从而在强化学习任务中大幅提高效率。
- 跨语法的句法变异:建模复杂自适应系统
该研究利用整个语法以及语法中的独立节点对方言之间的句法差异进行了系统建模,结果表明句法变异的重要部分是语法不同部分之间的相互作用,并且方言之间的相似性严重依赖于被观察的语法子集。
- 通过对比关系推理提升事件序列建模
我们提出了一种新颖的方法,利用神经关系推断来学习关系图,以从观测数据中推断事件相互作用,并同时学习动态模式。我们的方法在变分推断框架下对事件相互作用进行推理,并利用基于强度的学习来搜索原型路径以对比关系约束。在三个真实世界数据集上的大量实验 - 基于单调树的 GAMI 模型:XGBoost 的适应
使用 XGBoost 算法开发了单调树型 GAMI 模型,通过过滤技术确定重要交互作用、拟合单调 XGBoost 算法并解析结果得出单调 GAMI 模型。
- ICCV多标签自我中心视觉感知映射
准确的多标签感知能力和分割是基于交互的许多复杂系统中的重要组成部分。我们提出了一种新的感知能力方法,它能够实现准确的多标签分割。该方法可以从交互的第一人称视频中自动提取基于环境的感知能力,并提供感知能力位置的像素级精度。使用此方法构建了基于 - 自然发生的人机交互的顺序注释:初步洞察
我们提出了一种方法来改善嵌入式对话代理的交互,该方法基于 Conversation Analytic 的序列和多模态分析,使用实例是 Pepper 机器人在图书馆中向用户提供信息和指导,通过创建一个自然发生的交互语料库并提供给社区,提出并学 - ICCV基于人属性的交互感知联合注意力估计
本文提出了单张图像中的联合注意力估计,通过引入上下文线索、模拟各属性之间的相互作用,并采用基于 Transformer 的注意力网络来编码联合注意力为低维特征。通过预测像素级联合注意力的置信度热力图,改善了热力图的准确性,并结合了图像的普通 - 在多机器人网络中,从节点轨迹中学习识别图形
该研究提出了一种基于学习的方法,结合了强凸规划和自注意力编码器,可以有效地揭示图的拓扑结构以及预测适当的正则化参数,从而解决了网络配置不同的情况下图拓扑的识别问题。
- 机器人和人工智能中应用效用理论的理解:综述
本文介绍了一种针对多智能体 / 机器人系统的实用模型,旨在引导智能体选择合理的策略,达到其当前需求和学习合作,建立稳定可靠的关系,保证每个组成员的可持续发展,并且提出了几个有前途的研究方向。
- 多模态融合交互:人工智能量化的研究
研究了如何通过人工注释对多模态交互进行分类,提出了信息分解方法,比较了部分标签和反事实标签的机会和限制,并提出了一种自动转换方法以量化多模态数据集中的交互
- HOP, UNION, GENERATE: 可解释的无需理由监督的多跳推理
该研究提出了一种基于概率的方法来训练可解释的多跳问答系统,该系统可以在无需基于理由的监督的情况下进行训练。该方法将理由明确建模为集合,能够在文档之间以及文档内部的句子之间进行交互和多跳推理,这种方法在选择理由方面比之前的方法更加准确。
- 交互式自然语言处理
该论文对 iNLP 的定义、分类、评估方法、应用和未来研究方向进行了综合性调查,旨在为研究人员提供广泛的视野和工具,以促进与人类、知识库、模型和环境的交互、交流和合作。
- 建模空间 - 时间交互以进行组合动作识别
该研究提出组合动作识别的方法,并使用时空交互编码器捕捉人体 - 物体之间的交互作用并将其与视频信息相结合。该方法在多个数据集上获得了先进的性能,表明显式地对人体 - 物体之间的交互行为建模是有效的。