BriefGPT.xyz
Ask
alpha
关键词
performance decline
搜索结果 - 4
基准自演进:一种用于动态 LLM 评估的多智能体框架
该研究提出了一个基准的自我演进框架,动态评估迅速发展的大型语言模型(LLMs)的能力和限制,实施基于多智能体系统的重构操作来构建演进实例,对 LLMs 进行更可扩展、稳健和细粒度的评估,并发现它们在多个任务上的性能普遍下降。
PDF
5 months ago
Lissard:长且简单的顺序推理数据集
论文介绍了一个基准测试集 Lissard,其中包括七个任务,旨在评估模型处理和生成不同长度序列以及需要重复操作的能力。评估结果显示,无论是开源模型(Mistral-7B 和 Mixtral-8x7B)还是专有模型(GPT-3.5 和 GPT
→
PDF
5 months ago
基于多模态协作变压器和混合特征重建的强鲁棒情感识别
多模情感识别是情感计算的重要方面,本文提出了一种统一框架 Modality-Collaborative Transformer with Hybrid Feature Reconstruction (MCT-HFR) 来解决构建不对齐多模特
→
PDF
6 months ago
开发联邦学习以实现深度模型的潜力
在研究中,发现当将现有的联邦学习框架应用于更深的神经网络时,性能会显著下降,主要原因是由于在层间反向传播过程中不同客户端模型之间的不一致性逐步积累,称为 “发散累积”,提出了减少发散的技术指南,如使用更宽的模型和减少接受场,这些方法可以大大
→
PDF
a year ago
Prev
Next