- MLPHand:基于 MLP 建模的多视角实时三维手部网格重建
研究提出了 MLPHand,一种用于实时多视图单手重建的新方法。MLPHand 包含两个主要模块:轻量级的基于 MLP 的 Skeleton2Mesh 模型,以及使用多视图几何特征融合预测模块增强 Skeleton2Mesh 模型。实验表明 - 单目 RGB 相机空间下的三维手部网格恢复
利用虚拟现实、增强现实和手势控制等技术的快速发展,用户期望与计算机界面的交互更加自然和直观。本研究提出了一种网络模型,可从单目 RGB 图像中恢复相机空间中的 3D 手部网格,以实现准确和可靠的绝对空间预测。通过在大规模手部数据集 Frei - 探索人与语言模型协同推动定性分析的潜力:以心理疾病歧视为例的案例研究
CHALET 是一种结合人工智能模型与人类合作的新方法,用于促进质性研究的概念化和推动质性分析的新观点生成,通过应用于心理疾病污名归因模型,揭示了认知、情绪和行为维度上的隐性污名化主题。
- 追踪转变对象:基准测试
通过收集一个新的专为追踪转变物体而设计的数据集,该研究桥接了目前主要关注追踪通用物体的研究与实际应用中对于追踪转变物体的需求,并对 20 种最先进的追踪算法进行了全面评估,旨在为未来研究和应用提供参考和对比。
- 三星中国研究院 - 北京在 SemEval-2024 任务 3 中的多阶段对话情感原因匹配系统
本研究提出了一个多阶段框架,旨在通过目标情绪生成情绪并提取情绪的因果对。我们的方法在竞赛中在两个子任务中均获得第一名。
- KDDFiper: 结合规则和特征重要性的基于视觉的解释
人工智能算法在多个高风险领域中已变得无处不在,但其内部逻辑可能对于人类而言难以理解。可解释的人工智能旨在设计工具和技术,以说明所谓的黑匣子算法的预测。人机交互界长期强调对可解释人工智能采用更加以用户为中心的方法的需求。本文提出了一种基于可视 - 扩展作者:探索学术写作中人工智能合作的潜力
这篇研究论文通过对比两个人工智能模型 Gemini 和 ChatGPT 的表现和互动,以协作性工具的角度,对将生成型人工智能(Gen AI)整合到学术写作过程中进行了批判性研究,通过促进研究人员参与设计能够引出特定人工智能回应以构建研究大纲 - 利用人工神经网络识别持续孟加拉语言中的说话者划分
通过应用连续的孟加拉语音,我们提出了一种方法来确定某个地区说话者的地理身份,使用了 Mel 频率倒谱系数(MFCC)和 Delta 特征在人工神经网络上对说话者进行分类,并在特征提取之前对原始音频进行了一些预处理任务。我们的数据集包括 63 - AI 接口中与设计模式互动的危害的特征和建模
设计增强的 AI 系统控制 (DECAI) 是一个概念性模型,它着眼于探讨接口在人工智能系统中的作用,通过两个案例研究展示了 DECAI 的应用价值。
- IJCAI高级交互式人机学习界面用于收集和学习复杂的注释
本文旨在通过为二分类任务提供人机学习界面,使人类注释者能够利用反事实例来补充标准的二分类标签,以缓解人类注释者适应传统标签所施加的限制。
- LLMs 作为写作助手:探索对所有权感和推理的观点
研究调查了写作中的所有权感、写作辅助工具、大型语言模型、创造性任务以及人机交互等问题,以提高写作辅助系统的性能。
- MambaTalk:带选择性状态空间模型的高效整体手势合成
表演合成是人机交互的重要领域,最近的研究基于扩散模型和注意力机制来改进表演合成,但由于计算复杂性较高,生成长且多样的序列仍然是一个挑战。我们探索使用状态空间模型来解决这个挑战,并实现了一种两阶段建模策略,并引入离散运动先验来提高表演质量。通 - 基于雷达的静态手势在美国手语中的识别
人机交互与虚拟现实领域中,自动手势识别变得越来越重要。本研究探索了使用合成数据的方法来训练神经网络,以在虚拟现实和人机交互应用中提高手势识别的性能。
- 利用人机交互提升计算机视觉数据集质量
本研究引入了一个轻量级、用户友好、可扩展的框架 “Multilabelfy”,通过人机智能的协同作用,实现了高效的数据集验证和质量提升,同时突出了多标签占比的重要性,发现 ImageNetV2 数据集中约 47.88% 的图像包含至少两个标 - 机器中的尸体:动作捕捉技术中的测量和验证社会实践
通过社会实践理论的视角,通过对一项系统文献综述研究(N=278)的发现进行分析,我们展示了测量和验证的社会实践是如何根深蒂固地融入运动捕捉设计和创新中的,并且我们展示了当代运动捕捉系统是如何延续对人体和其运动的假设。我们认为,在数据驱动和传 - 与人工智能和自然语言界面互动时应该说些什么?
人工智能与人类的交互越来越重要,人机交互的一个子领域人工智能与人的交互 (Human-AI Interaction) 的出现旨在探索人类与人工智能的交互方式及认知科学方面的影响。先前的研究表明,心智模型在成功与 AI 进行无障碍沟通中至关重 - 人体区域电容或电场感测用于人体活动识别和人机交互的综述
身体区域电容感知是一种有希望的可穿戴设备替代方案,用于实现人体活动识别和人机交互任务;本文综合总结了身体区域电容感知的现有研究,包括涉及的身体形态、硬件实现、算法和应用,并讨论了该领域的挑战和前景。
- MST:自适应多尺度令牌引导的交互式分割
通过多尺度令牌调整算法改善了交互式分割的准确度,以应对大目标和小目标间的准确度平衡挑战,并引入了对比损失以提高令牌的正确性和鲁棒性。与现有方法相比,该算法在绩效上达到了最新水平。发布了交互式演示和所有可复制的代码。
- 强化学习与人类反馈调查
深入探讨人机交互技术中基于人类反馈的强化学习(RLHF)的基本原理、应用及其研究趋势。
- 可解释的长期基于路标的轨迹预测模型
在复杂环境中预测动态实体的未来轨迹对于自动驾驶、机器人技术和人机交互等领域至关重要。本研究中,我们研究了在轨迹预测框架中加入长期目标对性能的影响,并提出了一种可解释的长期目标驱动预测框架 (WayDCM),通过编码他们与环境的互动以及长期目