- PRISM:一种用于切片级组织病理学的多模式生成基础模型
使用 Virchow 瓷砖嵌入和临床报告文本进行预训练的 PRISM 为 H&E 染色组织病理学提供了幻灯片级基础模型,能够生成临床报告,并通过线性分类器实现针对癌症检测、亚型识别和生物标志物预测等任务的高性能表现。
- 使用一半的数据和 400 倍少的计算资源训练高性能视网膜基础模型
人工智能在医学领域具有巨大潜力,但传统上受限于缺乏大量的数据集来训练模型。我们提出了一种新颖的 Token Reconstruction 目标,用于训练 RETFound-Green,这是一个只使用了 75,000 张公开可用图像和 400 - ChatGPT 和通用 AI 在图片中出人意料地很好地计算水果数量
物体计数是深度学习应用中的一个流行任务,通过对比传统方法和 ChatGPT 以及基于少样本学习的通用 AI 模型 (T-Rex),作者发现少样本学习的基础模型表现优异,并且 ChatGPT 在人类反馈下也显示出潜力,同时实现结果所需时间明显 - 推进医疗保健的基础模型:挑战、机遇和未来发展方向
基于现有数据进行预训练的基础模型在促进医疗卫生事业中发挥着积极作用,它打破了有限人工智能模型与多样化医疗实践之间的矛盾,提供了更广泛的医疗场景,从而改善智能医疗服务。本文对基础模型的挑战、机遇和未来发展方向进行了全面深入的调研和探讨,以期加 - SIGIRLLM-RecSys 文本 ID 学习对准
通过 IDGen 方法将每个项目表示为独特、简洁、语义丰富、与平台无关的文本 ID,并通过基于 LLM 的推荐系统和文本 ID 生成器的协同训练,无缝地将个性化推荐融入自然语言生成,从而建立了一个基础生成推荐模型。实验结果表明,该方法在标准 - VisionGPT:通用多模态框架基于视觉 - 语言理解 Agent
介绍 VisionGPT,通过整合和自动化最先进的基础模型,促进视觉语言理解和视觉导向人工智能的发展,具有高效性、通用性和性能表现的潜力。
- 基于基础的时间序列模型:合成与否?
该研究通过实验证明,在正常时间序列情况下,仅使用真实时间序列的数量有限的训练数据,相较于使用更多的合成数据进行训练,利用监督框架进行训练可以获得更好的结果。
- VEnvision3D:用于三维多任务模型研究的合成感知数据集
开发一个统一的多任务基础模型已经成为计算机视觉研究中的一个关键挑战。本论文介绍了 VEnvision3D,一个用于多任务学习的大型 3D 合成感知数据集,包括深度补全、分割、上采样、场景识别和 3D 重建。对于每个任务的数据在相同场景下收集 - 学习交付:蒙特利尔容量车辆路径问题的基础模型
提出了一种基于深度学习模型的单一解决方案,用于求解蒙特利尔容量约束车辆路径问题(MCVRP),该模型利用自然语言处理技术以及大型语言模型框架的 Transformer 架构来训练和生成更好的 MCVRP 解决方案。
- 填补基础模型后门漏洞的泥浆加固技术
提出了 Mudjacking,这是第一个用于修补基础模型以去除后门的方法,通过梯度下降的方法解决了将基础模型修补为优化问题,在保持其功用的同时成功去除了后门。
- VISION-MAE: 医学图像分割和分类的基础模型
人工智能(AI)在医学影像诊断和分割方面具有改革潜力,但其发展和临床应用面临多个挑战,包括数据有限性、泛化能力不足以及有效整合多模态数据的必要性。我们提出了一种新的基础模型 VISION-MAE,针对医学影像进行专门设计。VISION-MA - InfMAE:红外模式中的基础模型
本论文介绍了一种基于红外模态的基础模型 InfMAE,提出了适用于红外图像的信息感知遮罩策略、多尺度编码器和红外解码器模块,实验证明在三个下游任务中 InfMAE 方法优于其他监督学习和自监督学习方法。
- SamLP: 一个定制的切片任意物体模型用于车牌检测
本文介绍了基于深度学习的车牌检测方法,利用基础模型和低秩适应策略对车牌检测任务进行了改进,并实现了具有较好检测性能和少样本学习能力的车牌检测器。
- 关于操作系统的基础模型
本文研究了面向操作系统(OS)的特定领域基础模型的研究议程。我们提出了基础模型的案例,围绕着操作系统的多个组件(如 CPU、内存和网络子系统)相互关联的观察,并且利用操作系统的追踪数据集作为基础模型理解不同环境和工作负载下不同操作系统组件行 - Saturn 平台:金融服务的基础模型操作和生成性人工智能
Saturn 是一个创新平台,用于辅助基础模型(FM)的构建和与 IT 运营的整合。该平台定制来满足数据科学家的需求,使他们能够有效地创建和实施 FM,并增强其技术领域内的协作。Saturn 通过提供各种工具和功能,简化和自动化 FM 开发 - 从随机到基础模型的指导初始化在医学图像分割中的联邦学习中的起始点在哪里?
通过使用基础模型的巨大预训练知识作为以医学图像分割任务为例的 FL 模型初始化的指导教师,本研究首次尝试将基础模型作为 FL 初始化的教师,评估其对 FL 模型性能的影响,尤其是在非独立同分布数据场景中。经验评估结果表明,在胸部 X 光肺分 - SpectralGPT: 光谱基础模型
本研究提出了首个通用遥感(RS)基础模型 SpectralGPT,使用一种新颖的 3D 生成预训练变压器(GPT)来处理光谱 RS 图像,实现了在空间光谱耦合、光谱顺序模式捕捉及大规模 RS 大数据利用等方面的显著性能提升,对于实现地球科学 - 面向时间序列数据的基础模型
本文通过利用多个领域的无标签样本,旨在开发一种有效的时间序列基础模型。实验结果表明,与其他方法相比,该提出的预训练方法结合 Transformer 模型在下游分类任务中具有更好的性能。
- 大型基础模型中的幻觉调查
在这篇综述论文中,研究了大型基础模型(LFMs)中幻觉问题的最新进展,包括幻觉现象的分类、评估标准以及减轻幻觉的策略和未来研究方向。
- SeisCLIP:基于多模态数据预训练的地震学基础模型,用于多目标地震特征提取
通过对多模态数据进行对比学习,开发了 SeisCLIP 基础模型,以解决在地震学中特定任务的深度学习模型所遇到的标注数据不足和区域通用性有限的问题。该模型在事件分类、定位和震源机制分析等任务中的表现优于基准方法,适用于不同地区的不同数据集,