Apr, 2023

Multipar-T: 基于 Transformer 的多方对话捕捉待定行为

TL;DR为了解决AI系统中多方(群)对话的问题,我们提出了一种名为Multipar-T的变压器模型,其中的Crossperson Attention组件能够检测成对人之间的感应行为,该模型在公共视频小组交互检测基准测试中优于现有技术,并能够以10.0%的F-1分数提高个人分类F-1分数。