适用于快速从真实图像中提取中轴线的外观震荡语法
本文提出了一种图像分解的方法,使用 Diffusion 模型进行无监督训练,从而推断出图像中的各种组成部分,并展示了如何使用这些组成部分灵活地生成不同于训练时的场景。
Jun, 2024
通过使用第一次观测的隐式模型学习对象的几何和外观部分,并通过渲染第二次观测来蒸馏部分分割和关节运动,我们提出了一种新的无监督方法来学习刚性部分组成的关节对象的姿势和部分分割。此外,为了解决部分分割和关节运动的联合优化中的复杂性,我们提出了基于体素网格的初始化策略和解耦优化过程。与先前的无监督方法相比,我们的模型性能显著提高,且适用于具有多个部分的对象,且对后续观测可以高效地进行少数视图的操作。
Jun, 2024
通过引入支离破碎辅助正则化(Branch-out Auxiliary Regularization,BAR)方法,提升注视估计的泛化能力,无需对目标域数据进行直接访问,通过整合两个辅助一致性正则化方法,增强核心网络的能力并易于适应其他模型,实验证明该方法在四个跨数据集任务中具有卓越优势。
May, 2024
通过本文介绍的一种基于本地序列对齐的无监督方法,将诗歌文本编码为一系列韵律特征的字符串,从而检测诗歌中的结构相似性,以便进行跨语言和历史研究。
Apr, 2024
用强化学习和视觉语言模型(如 CLIP 和 BLIP2-ITM)增强图像描述模型(BLIP2)的无监督方法能够生成更长更全面的描述,并在 MS-COCO Carpathy 测试集上获得了令人印象深刻的 0.90 R@1 CLIP 回忆得分。
Apr, 2024
该研究报告描述了 WangchanLion 的开发,它是一种针对泰语机器阅读理解(MRC)的指令微调模型。通过使用泰语 MRC 数据集进行广泛的实验研究,我们证明了该模型在零次训练和一次训练设置下,能够理解上下文并生成与参考答案一致的回答。此外,我们还提出了一种新的评估方案,评估答案的正确性、帮助性、简洁性和上下文相关性,评估结果为未来改进模型提供了见解。
Mar, 2024
社交媒体平台的兴起导致了在线讨论的极化增加,特别是在选举和气候变化等政治和社会文化议题上。我们提出了一种简单而新颖的无监督方法,利用用户在帖子中关于命名实体的观点,预测两个帖子的作者是否持相同立场。我们提出了 STEntConv,这是一种构建用户和命名实体之间带权重的图,并训练带符号图卷积网络(SGCN)来检测评论和回复帖子之间的分歧的模型。我们进行了实验和消融研究,并展示了在 Reddit 帖子数据集上,包含这些信息可以提高针对一系列有争议的子论坛主题的分歧检测性能,而无需特定平台特征或用户历史记录。
Mar, 2024
本文提出了一种基于深度强化学习的无监督的主动血管 DSA/CTA 刚性配准方法 UDCR,通过重叠度计算奖励函数来衡量分割图与 DSA 图像之间的配准准确性,该方法具有高度灵活性,可用于临床应用。
Mar, 2024
提出了一种名为 Offline Imitation Learning based Anomaly Detection (OIL-AD) 的无监督方法,使用行动优化和顺序关联两个抽取的行为特征来检测决策序列中的异常,通过学习 Q 函数和状态值函数从正常轨迹中提取这两个特征,实现了在线异常检测性能上显著提高,F1 分数比可比较的基线模型提高了 34.8%。
Feb, 2024