- 自主深度自我学习与可视化的自动手势识别
本研究利用深度学习探索了三种不同的方法来识别手势:基于监督学习的方法、自监督学习方法和基于可视化的技术应用于三维运动骨架数据。实验结果表明,监督学习方法能够准确识别手势,而自监督学习方法在模拟环境中提高了识别准确性,Grad-CAM 可视化 - 弥合交流鸿沟:人工智能代理通过模仿学习手语
通过从演示中学习,我们研究了通过获取非语言交流技能,特别是手语理解和表达方面的潜在应用,我们专注于对人工智能代理进行模仿学习,使用计算机视觉和深度学习从视频中提取信息,并使用强化学习使代理能够复制观察到的动作,这种方法消除了需要额外硬件的需 - 增强人工智能与人类互动的语言模型手势理解探究
该研究论文探讨了大型语言模型(LLMs)与非语言交流(特别关注手势)的相互作用,并计划通过实验测试 LLMs 对手势的理解能力和上下文解释。
- 基于深度生成网络的语音融合生成的神经语音嵌入
脑到语音技术可直接将脑信号转化为语音,通过神经表征学习与语音合成相结合,以提高自然交流的流畅性,可能为非语言沟通带来创新。本文介绍了当前的脑到语音技术,探讨了脑信号转化为语音的可能性,并对执行语音时的神经特征和神经语音嵌入进行了综合分析,这 - 身体语言识别与生成的深度多模态学习调查
通过深度多模态学习,本文首次全面探讨了身体语言生成和识别,讨论了现有进展、挑战和未来方向,并为研究人员和从业者提供了有价值的资源。
- 笑声重要:基于扩散模型的笑脸生成介绍
本文提出了一种新颖的模型,可以在给定一个静止肖像和一个包含笑声的音频剪辑的情况下生成逼真的笑声序列,该模型使用扩散模型的最新进展,解决了传统面部动画方法的失败案例,针对笑声引入了一种评估指标,获得了所有指标的最先进表现。
- 民粹主义面孔:使用机器学习分析政治领袖面部情绪表达的差异
本文通过采用基于深度学习的视觉算法对 220 个来自 15 个不同国家的 YouTube 视频的情感分析,观察发现具有民粹主义 retoric 演讲的政治领袖比非民粹主义演讲者在公开演讲中表现出更多的负面情绪,揭示了政治领袖视觉化自我表达的 - MM艺术历史图像中的半监督人体姿态估计
本文提出了一种在艺术历史图像中估计人类姿势的新方法,通过半监督学习对目标和关键点检测进行了改进,并且引入了一个包括人体姿势标注的新领域特定艺术数据集,相对于使用预训练模型或风格转移的方法,达到了显著更好的结果。
- 虚拟手套标记的实时手势识别
本文提出了一种基于实时计算机视觉的手势识别应用程序的自然用户界面工具,该工具使用用户手上的虚拟手套标记作为输入,并采用深度学习模型进行实时手势识别。研究表明,该系统可以在社交互动和康复等实时应用中发挥有效作用。
- 利用 ERIK 将任务相关的表现力编码到自主社交机器人的动画中:前卫的萨蒂!
ERIK 是一种表达负向动力学技术,已经在算法上和有限的用户交互场景中得到了评估。它允许自主的社交机器人在注视着用户时传达基于姿态的表达信息,并通过实验表明,ERIK 可以通过其非语言表现形式完全引导用户在执行给定任务时作出选择。
- ACL对粉丝小说情感传播渠道的分析:走向情感叙事
分析非言语传达情感的方法,发现人类写作的小说可以通过多种非言语渠道传递角色情感,建议自动故事讲述系统在生成角色情感描述时应考虑情感的可变性。
- 在自然社交互动中检测眼睛注视并应用于儿童评估
该研究提出了一种新的方法来检测儿童与成人之间的眼神接触,该方法利用深度学习架构 Pose-Implicit CNN 来预测眼神接触并估计头部姿态,该方法已经在 100 个儿童的数据集上训练成功,精度、召回率和 PR 曲线下的面积均较以往方法 - 多智体群体中基于实例的组合语言的出现
本文研究了如何在多智能体种群中产生基础的组合语言,并观察到当语言交流不可用时,指向和引导等非语言交流方式的出现。
- 口头和非口头人机交互通信综述
本文概述了人机互动通信的口头和非口头方面,提出了十个期望,这些期望为研究人 - 机器人通信的最近和未来提供了组织轴。