- 通用到医疗应用的大型语言模型调查:数据集、方法论和评估
大型语言模型(LLMs)在各种自然语言处理任务中表现出令人惊讶的性能。最近,结合领域特定知识的医学 LLMs 在医疗咨询和诊断方面展现出卓越能力。本文系统地探讨了如何基于通用 LLMs 训练医学 LLMs,并提供了指导各种医学应用的 LLM - 优势在于差异!通过量身定制的策略规划实现有效的非合作性对话
提出了 TRIP 用于增强定制战略规划的能力,通过引入用户感知的战略规划模块和基于人口统计的训练范式,解决了现有对话代理面临的两大挑战:无法将用户特定特征纳入战略规划以及无法对多样化用户进行泛化训练。通过在标准的非合作对话任务上进行实验,证 - TimeSeriesBench:时间序列异常检测模型的工业级基准
TimeSeriesBench 是一个工业级基准测试平台,通过多个训练和测试范式、评估指标和数据集的结合共计 168 个评估设置,评估了现有算法的性能,并提供了异常检测算法的未来设计建议。
- 分而治之:重新思考神经辐射场的训练范式
通过将输入视图按照其视觉相似性划分为多个组,并在每个组上训练单独的模型,然后通过教师 - 学生蒸馏范式将这些专门模型的知识聚合为一个实体,我们重新设计了 NeRF 的训练范式,提高了其渲染质量并实现了空间效率。
- AE-Flow:自动编码器归一化流
我们引入一种新的训练范式:自编码器归一化流(AE-Flow),它通过添加重构损失,使模型使用条件信息重构音频样本,结果表明该方法在正常化流的训练中系统地提高了说话者相似性和自然度。
- GraFT: 渐进融合变换器用于多模态再识别
Gradual Fusion Transformer (GraFT) is proposed for multimodal Object Re-Identification (ReID), employing learnable fusio - 在模拟人类社会中训练基于社交对齐的语言模型
提出一种新的 LMs 训练范式,让其可以从模拟社交互动中学习,从而使人工智能系统更好地符合社会规范和价值观。
- ACL利用自动问答评估器的监督学习答案生成
本研究通过提出一种新的 GenQA 训练范式,利用自动 QA 评估模型(GAVA)中的监督进行知识转移,比以往的基于 AS2 模型的抽取式 QA 方法有更高的准确率,方法包括:用由 GAVA 标记的 GenQA 模型生成的答案增加训练数据, - 多臂老虎机用于多任务神经求解器的高效训练
本文提出了一种基于多臂老虎机的通用高效训练模式,通过理论损失分解和逐任务影响矩阵使多任务神经求解器的训练更高效,证明了该方法的优越性和在多任务大模型训练中的应用前景。
- ICLR基于图像对比学习的基于骨架的动作识别
本文提出了一个骨架动作识别的图形对比学习框架(SkeletonGCL)来探究跨所有序列的全局上下文,在多个上下文尺度上进行图对比学习,从而建立了一个新的训练范式,并可以无缝地融合到当前 GCNs 中,在 NTU60,NTU120 和 NW- - ACLBRIO:让抽象化摘要更有序
提出了一种新的非确定性分布训练方法,通过根据其质量分配概率质量到不同的候选摘要,从而解决确定性分布训练方法在推断时导致的性能下降问题, 在 CNN/DailyMail 和 XSum 数据集上均取得了优于现有方法的最优结果,并且与质量水平更相 - ACLOne2Set:生成关键词集合的多样性关键词生成模型
本研究提出一种新的训练模式 One2Set 及利用对一组特定控制码的应用实现并行生成关键词集的新型模型,同时通过二分图匹配的 $k$-step 目标分配机制增加关键词生成的多样性和降低重复率,实验结果表明本方法显著优于现有最优方法。
- ICCV挑战性环境下的无监督视频深度学习
提出了基于光流的新训练范式,它通过提供更清晰的训练目标和处理非纹理区域来降低无监督学习的难度,并处理室内环境中的挑战,实验结果与全监督方法相当。
- 用于训练人脸识别 CNN 的噪声容忍模式
使用加权样本的训练范式,基于角边缘损失函数训练深度卷积神经网络模型既可消除噪声数据效应,又可以在大规模人脸识别数据集上实现高精度识别。