Jul, 2023

GOKU-UI: 连续时间生成模型的注意力和多次射击普遍推理

TL;DR本文介绍了 GOKU-UI,一个基于 Scientific Machine Learning(SciML)演化而来的生成模型,它通过在潜空间中使用注意力机制和新型的多发射训练策略,结合不同种类的微分方程,实现分布式推理,显著提高了模型的性能。研究证明,GOKU-UI 具有很高的数据效率,不仅优于基线模型,还能够在重建和预测任务中超越实时方法,并且可以为大脑功能提供有益的见解和开放可行的实际应用,如心理状态或精神状况分类。