BriefGPT.xyz
大模型
Ask
alpha
关键词
training pipelines
搜索结果 - 3
ICLR
不要以貌取人:视频识别的运动一致增强
本研究探讨了色调变化对视频识别的影响,并提出了一种名为 Motion Coherent Augmentation(MCA)的数据增强方法,通过引入视频中的外观变化,隐式地鼓励模型优先考虑动态模式而非静态外观。我们提出了一个名为 SwapMi
→
PDF
4 months ago
可组合功能保持扩展的 Transformer 架构
通过逐步增加转换器神经网络的大小,以保留功能,并在最小初始化约束下提供确切的功能保留证明,本研究提出六种组合的转换方法,可能通过逐步扩展架构来实现更大、更强大的模型的高效训练管道。
PDF
a year ago
多语言语法错误修正的简单配方
本文提出了一种简单的方法来训练最先进的多语言语法纠错模型,使用大规模多语言语言模型来优化,建立并发布了基线数据集 cLang-8,通过单步微调得出了英语的精确度提高。
PDF
3 years ago
Prev
Next