BriefGPT.xyz
大模型
Ask
alpha
关键词
performance levels
搜索结果 - 2
ICLR
從原則出發的數據選擇,為 LLMs 的預熱微調提供更多、花費更少
使用无标签开放数据进行预精调预训练语言模型以最小化领域特定数据需求,并在达到预期性能水平的同时选择数据以将预训练分布推向目标分布的优化方法,展示了该方法在各种任务中的优越性和快速性,为经济高效的微调奠定了基础。
PDF
2 months ago
仅用于困难音频的大模型:高效推理的样本相关私语模型选择
基于自动语音识别(ASR)领域中模型尺寸和推理成本的观察,通过训练一个决策模块,可以在测试数据的大部分模块上使用最小的足够模型达到良好的转录效果,从而实现了相当大的计算节省和性能提升。
PDF
9 months ago
Prev
Next