- LLMs 在因果推断上容易出现谬误
本研究通过合成数据对预训练语言模型进行微调,验证了模型对于从文本中推断因果关系的能力,发现模型容易根据实体在文本中的出现顺序推断因果关系,但在因果关系推断方面存在后验谬误,且对于反事实关系的推断较为困难,从而对模型对因果关系的理解提出了质疑 - 基于深度域自适应和时间关系信息的跨用户活动识别
基于深度时间状态领域自适应(DTSDA)模型,本研究旨在解决跨用户人类活动识别(cross-user HAR)中的行为变异性问题,通过利用活动中的不同子活动之间的时间关系,DTSDA 模型能够在不同用户之间建立起用户不变的时间关系,从而在跨 - AAAIREAD-PVLA: 低资源视频 - 语言建模中的参数高效迁移学习的循环适配器及部分视频 - 语言对齐
针对预训练大规模 Transformer 模型在视频 - 语言建模任务中存在的存储成本高和训练不稳定等问题,本文提出了一种轻量级适配器方法,通过引入循环计算和部分最优传输来捕捉视频帧和文本单词之间的时间关系,以及保留任务相关信息,并在多个低 - MMRTQ:基于图文模型重新思考视频语言理解
我们提出了一种名为 RTQ(Refine,Temporal model 和 Query)的新型框架,同时解决了视频语言理解中的信息冗余、时序依赖和场景复杂度等挑战,这种方法通过对帧内冗余信息的优化、建模帧之间的时序关系和从视频中查询任务特定 - STUPD: 用于空间和时间关系推理的合成数据集
提出了 Spatial and Temporal Understanding of Prepositions Dataset (STUPD) - 一个用于理解静态和动态空间关系的大规模视频数据集,旨在帮助模型在真实世界场景中更好地进行视觉关 - 运用基于属性和关系的相似案例解释:一种可解释的区分疼痛和厌恶面部表情的方法
通过对比样例解释概念是一种有效和方便的方式,可以深入了解分类决策背后的原因。本文提出了一种生成对比解释的方法,以解释视频序列中的疼痛和厌恶的面部表情。我们比较了两种生成对比解释的方法,并发现近似解释要比远离解释更短,这与应用的相似性度量无关 - ICCV不确定性感知的无监督多目标追踪
通过开发一个基于不确定性的度量标准,以验证和矫正风险的关联,本论文提出了一种通过模拟 tracklets 运动来增强学习特征一致性的 tracklet-guided 增强策略,同时采用分层不确定性采样机制进行难样本挖掘。最终的无监督 MOT - ChatGPT 句子级关系评估:重点关注时间、因果和语篇关系
该研究针对 ChatGPT 大型语言模型,通过对 13 个数据集的测试集进行综合评估,采用了三种任务定制型 prompt 模板,发现 ChatGPT 对于识别因果关系具有较强的能力,但在识别事件之间的时间顺序方面表现较差,并在需要结构性理解 - CVPR语言模型是零 - shot 视频问答的因果知识提取器
提出了一种从语言模型中提取因果知识的框架 CaKE-LM,用于解决视频因果问答问题(CVidQA),并在 NExT-QA 和 Causal-VidQA 数据集上取得了显著的优势。
- 区间逻辑张量网络
本文介绍了一种名为 Interval Real Logic(IRL)的两重逻辑,该逻辑使用具有实际特征数据序列来解释知识,我们使用模糊逻辑解释连接词,使用梯形模糊间隔解释事件持续时间,使用间隔面积之间的关系解释模糊时间关系,同时介绍了 In - 基于贝叶斯翻译模型的事件时间关系提取
本研究通过使用 Bayesian-Trans 的贝叶斯学习方法,建立了一个以潜在变量为中心的模型来对事件之间的时间关系进行建模,具有更强的对预测不确定性的编码和表达的能力,并且在事件之间的时间关系抽取上表现出更好的性能。
- 基于时间逻辑模式的面向结果的处方式过程监控
提出了一种基于结果导向的 Prescriptive Process Monitoring 系统,该系统使用线性时间逻辑来定义活动之间的时间关系,通过训练机器学习分类器来预测目标结果,并在运行时返回最显著的时间模式。
- 多尺度对比协同训练用于事件时间关系抽取
MulCo 是一种用于更好地融合 BERT 和 GNN 对本地和全局上下文特征的技术,通过对比 GNN 多层多跳子图(全局上下文嵌入)和 BERT 输出(本地上下文嵌入),MulCo 实现了 GNN 和 BERT 模块的协同参数化。MulC - Transformer 在时间序列预测中是否有效?
通过简单的线性模型实验发现在长期时间序列预测任务中,线性模型 LTSF-Linear 的效果优于复杂的基于 Transformer 方法,这引发人们对该任务以及其他时间序列分析任务中基于 Transformer 方法的有效性的反思。
- CVPRBiCnet-TKS: 学习视频人物再识别的高效时空表示
本文提出了一种高效的时空表示方法 BiCnet-TKS,并通过在原始分辨率和下采样策略上处理连续帧以获取目标身份的全面特征;该模型包含多个并行的和多样化的注意力模块以发现连续帧的不同部位,在任何深度插入 TKS 模块以捕捉短期和长期的时间关 - 基于最优传输的受损度量下小样本动作识别
该研究提出了一种基于代价度量的方法,融合了视频中的语义和时间信息,以优化运输框架来识别视频中的无法见类行为,它具有包括内容和排序敏感任务的判别能力,并在基准数据集上表现出卓越的性能。
- CVPR少样本动作识别的时间关系跨变换器
本文提出了一种新的少样本动作识别方法,利用跨时间关系交换器构建类原型,形成有序帧的视频表示,依靠匹配多个支持集视频和学习高阶关系交换器,取得了 Kinetics、Something-Something V2(SSv2)、HMDB51 和 U - AAAI使用概率软逻辑正则化和全局推理进行临床时间关系提取
该研究提出了一种新的基于概率软逻辑规则和全局推理的方法,名为 CTRL-PG,用于从文档层面解决临床事件的时间关系提取问题,并在两个基准数据集上进行实验,结果显示 CTRL-PG 显著优于基准方法。
- EMNLP使用 WikiHow 进行目标、步骤和时间排序的推理
该研究提出了关于过程事件中两种类型的推理任务:目标 - 步骤关系和步骤 - 步骤时间关系。通过基于 how-to 文章的 wikiHow 数据集,建立人类验证的测试集和生成自动训练集。经实验证明,训练集有效地提高了在 SWAG,Snips - 探索用于时间依存句法分析的上下文化神经语言模型
本文基于 BERT 开发了几种 BERT-based 时间依赖句法分析器,表明 BERT 显著提高了时间依赖分析的性能。并对于深度上下文化语言模型有哪些帮助及不足进行了详细分析。