AGRR-2019: 俄语间断语句的语言语料库
T2V 生成在最近受到了很大的关注,然而仍面临两个重要的挑战:缺乏精确的开源高质量数据集,以及未充分利用文本信息。为了解决这些问题,我们介绍了 OpenVid-1M,一个精确的高质量数据集,以及一种能够从视觉标记和文本标记中提取结构信息和语义信息的新型多模态视频扩散变换器(MVDiT)的提议。广泛的实验和消融研究验证了 OpenVid-1M 优于以前数据集的优越性和我们的 MVDiT 的有效性。
Jul, 2024
本文提出了一种针对图分类的算法,通过吸收来自不同类型任务的观点,旨在增强图分类中的适应性、可扩展性和泛化性,通过学习整个图的核心子图,重点关注与任务相关的最重要特征,从而改善模型性能、增加领域适应性并增强对领域变化的鲁棒性。实验结果表明,与现有方法相比,我们的方法取得了显著的性能提升。
Jul, 2024
通过创造一种新的损失函数,将目标分类损失和成员推断损失相结合,用于从神经网络中删除敏感信息的机器遗忘机制,本研究通过成员推断机制作为概念验证,提供了实验证据,证明了我们的遗忘方法在遗忘效果、延迟和主要任务准确性方面的优越性。
Jul, 2024
从有限数量的密度观测结果中估计两个概率密度的比率是机器学习和统计学中的一个核心问题。本研究从一类 Bregman 散度中的预设误差度量出发,表征了导致密度比率估计具有小误差的所有损失函数,并提供了一个简单的构建具有特定属性的损失函数的方法。
Jul, 2024
梯度下降优化在机器学习的成功中起到了关键作用,本研究论文聚焦于嵌套优化问题,特别是超参数优化和生成对抗网络;然而,在大规模求解嵌套问题时,经典方法往往表现不佳,因此我们针对深度学习环境构建了可扩展的嵌套优化工具。
Jul, 2024
在这项研究中,我们提出了一个名为 PCX 的库,旨在解决机器学习中预测编码网络的效率和可扩展性问题,并使用 PCX 实现了一系列用于实验的基准测试。我们通过广泛的基准测试和算法比较,展示了 PCX 的高效性,并指出了需要解决的潜在局限性,为解决该领域的主要开放问题之一 —— 可扩展性提供了基准。
Jul, 2024
提出了一种名为 VisEval 的新的 NL2VIS 基准,该基准通过引入高质量大规模数据集并倡导综合自动化评估方法,揭示了目前研究中普遍存在的挑战并为未来的进一步发展提供了重要的见解。
Jul, 2024
通过机器学习、深度学习和计算机视觉技术,该研究旨在应用 MobileNet SSD 模型进行实时动物分类,以解决农业领域野生动物对作物的威胁,通过智能稻草人与目标检测的无缝集成,为精准农业提供了一种健壮的解决方案。
Jul, 2024
该研究构建了一个包含 112 万条与健康相关的谣言的数据集(HealthRCN),并提出了用于中文健康谣言检测和可解释性的检索增强型大语言模型(HRDE),通过检索相关信息来准确判断输入的健康信息是否是谣言,并提供解释性回应,从而帮助用户验证健康信息的真实性。在评估实验中,HRDE 在谣言检测准确性和回答质量方面表现优于其他模型,包括 GPT-4-1106-Preview,平均准确率为 91.04%,F1 得分为 91.58%。
Jun, 2024