BriefGPT.xyz
大模型
Ask
alpha
关键词
neural parameters
搜索结果 - 2
FootGPT:基于简单环境的大型语言模型开发实验
通过使用低阶适应的方法,我们在基于意大利足球联赛前十轮的球队统计数据上进行了一个十亿参数规模的通用因果语言模型的微调,结果观察到在开发特定目的的语言模型时,数据集内容和训练策略比起神经网络参数数量、训练时长或数据集大小更为重要。
PDF
a year ago
MM
HyperConformer:用于高效语音识别的多头超级混合器
本文介绍了一种名为 HyperConformer 的语音识别结构,它通过引入高效的 HyperMixer 机制,实现了对于长输入序列较为经济的全局交互建模,并在可获得的训练数据限制下达到与或高于传统结构 Conformer 相似的识别表现。
PDF
a year ago
Prev
Next