BriefGPT.xyz
大模型
Ask
alpha
关键词
multiple shooting training
搜索结果 - 1
GOKU-UI: 连续时间生成模型的注意力和多次射击普遍推理
本文介绍了 GOKU-UI,一个基于 Scientific Machine Learning(SciML)演化而来的生成模型,它通过在潜空间中使用注意力机制和新型的多发射训练策略,结合不同种类的微分方程,实现分布式推理,显著提高了模型的性能
→
PDF
a year ago
Prev
Next