- 多模态基础模型中的多示例上下文学习
多模态基础模型在少样本上下文学习中具有较高的效果,通过扩展到多样本上下文学习,可以显著提高模型性能和数据效率。
- LaT-PFN:一种用于上下文时间序列预测的联合嵌入预测架构
LaT-PFN 是一种具有强大嵌入空间的时间序列模型,可以实现零点预测,并通过利用 JEPA 框架和 PFN 框架进行上下文学习来改善结果。
- SciQAG: 自动生成科学问答数据集的框架及细粒度评估
通过从科学文献中提取的信息,利用科学问答对生成的自动评估框架 SciQAG 表明,大型语言模型可用于从文献中提取关键知识的高质量科学问答对。
- ACL全球与本地级科技文档摘要的分层注意图
我们提出了 HAESum,一种利用图神经网络在基于分层话语结构的文档中进行局部和全局建模的新方法。通过使用局部异构图来学习句内关系,然后引入一种新颖的超图自注意层以进一步增强句间高阶关系的表征,在两个基准数据集上验证了我们的方法,实验结果表 - 基于范围图像的点云分割中缺失值的填充的重要性
点云分割在机器人感知和导航任务中起着重要作用,本文提出了一种新的投影方法,以及简单有效的填充方法,并介绍了两个网络模型,通过采用这些方法,现有的基于范围图像的点云分割模型在性能上取得了明显的改善。
- 通过质量多样性数据合成和语言模型的生成设计
通过将优化、约束满足和语言模型结合起来,我们提出了一种新颖的方法来解决工程应用中生成模型面临的两个基本挑战:获取高性能多样的数据集和生成符合精确约束的设计。我们的方法使用品质多样性 (Quality-Diversity, QD) 生成多样化 - LFED:用于大型语言模型的文学小说评估数据集
我们提出了一个文学小说评估数据集(LFED),该数据集旨在评估大型语言模型(LLMs)在长篇小说理解和推理方面的能力。通过对 95 部文学小说进行收集,我们定义了一个包含 8 个问题类别的问题分类体系来指导创建了 1,304 个问题。此外, - DocuMint: 使用小型语言模型为 Python 生成文档字符串
通过数学公式和人工评估使用 Likert 量表对性能进行定量评估和质量评估,研究了小型语言模型在生成高质量文档字符串方面的有效性,并引入了包含 10 万个样本的大规模监督微调数据集(DocuMint)。
- 以交通视角再审视深度语音文本检索
提出了一种基于小批量学习匹配 (m-LTM) 框架的音频 - 文本检索方法,包括使用小批量子采样和马氏增强的地面度量系列以及使用部分最优传输来应对训练数据中的错位数据对。在多个数据集上的实验证明,该方法能够学习丰富、表达力强的联合嵌入空间, - Qiskit 中基因组数据的量子机器学习算法的独立实现
本文探讨了量子机器学习的潜力,通过在 Qiskit 中利用多种特征映射技术对基因组序列分类,扩展、实现和评估了量子支持向量分类器(QSVC),Pegasos-QSVC,变分量子电路(VQC)和量子神经网络(QNN)等算法。
- 在光滑条件下估计一个函数及其导数
从一个嘈杂的数据集中估计未知函数 f * 及其偏导数,对两种估计器进行了证明、一致性研究及收敛速率分析,并在对股票期权和其二阶导数估计为基础股票价格函数的情况下进行了数值验证。
- 辩论:基于魔鬼辩护的评估与文本评价
提出了一种基于多智能体评分系统的自然语言生成(NLG)评估框架 DEBATE,通过引入反对者的概念,解决了 LLM 智能体回答中的偏见问题,从而在 NLG 评估中显著超越了现有的方法。
- CVPRFFF: 修正有缺陷的基础对比预训练会得到非常强大的视觉 - 语言模型
本文研究视觉语言对比预训练中的问题,提出了解决负样本分配不正确和字幕质量低和多样性不足的有效方法,并通过使用 sigmoid loss 进行训练,在图像识别和图像检索方面取得了非常大的增益。
- 从无监督领域自适应角度重新思考基于弱监督分割
本论文提出了一种仅使用有限的标注数据和大量未标注图像的单张标注数据训练模型而不依赖图像配准的几乎无监督医学图像分割(BSS)方法,采用无噪声标注数据构建算法和频率空间混合策略,用于减轻数据间的领域转移问题,实验证明该方法对 BSS 具有很高 - FinTextQA:长文本金融问答数据集
该研究介绍了 FinTextQA,这是一个用于金融领域长篇问答的创新数据集,并开发了一个基于 RAG 的 LFQA 系统,通过多角度评估方法得出了在噪声环境下不同配置的 LFQA 系统的性能表现和模型对噪声的容忍度。
- 变色龙:混合模式早期融合基础模型
Chameleon 是一种早期融合的基于令牌的混合模态模型系列,能够理解和生成任意顺序的图像和文本。它在图像问答、图像描述、文本生成、图像生成和长格式混合模态生成等任务上展现了广泛和通用的能力,包括在图像描述任务中达到了最先进的性能水平,同 - 量子视觉变压器用于夸克胶子分类
提出了一种混合量子 - 经典视觉转换器架构,其特点是在注意机制和多层感知机中集成了变分量子电路。该研究解决了计算效率和资源限制在分析未来的高亮度大型强子对撞机数据方面的重要挑战,提出了该架构作为潜在解决方案。通过将该模型应用于 CMS 开放 - ACL基于时间线的句子分解与上下文学习的时间事实提取
本文主要研究了从自然语言文本中提取时间事实的方法,提出了基于时间轴的句子分解策略,利用大型语言模型进行上下文学习,以确保对各种事实相关的时间轴有更细粒度的理解。同时,介绍了一种将大型语言模型的分解能力与传统小型预训练语言模型的微调相结合的方 - Turkronicles:快速演变的土耳其语的历时资源
自 1923 年土耳其建国以来,土耳其语发生了大量变化。本研究旨在调查土耳其语的演变,首先介绍由土耳其官方公报构建的土耳其历时语料库 Turkronicles,然后扩展现有的土耳其历时语料库,最后通过分析这两个历时语料库回答两个主要研究问题 - 多尺度扩散频域精化超分辨率
提出了一种新颖的基于频域引导的多尺度扩散模型(FDDiff),该模型通过细化的步骤将高频信息的补充过程分解为更精细的步骤,使用小波包频域链提供多尺度的中间目标,以逐步补充缺失的高频细节,并利用多尺度频率细化网络在一个统一的网络中预测所需的多