Apr, 2024
AntBatchInfer:Kubernetes 集群中的弹性批量推断
AntBatchInfer: Elastic Batch Inference in the Kubernetes Cluster
Siyuan Li, Youshao Xiao, Fanzhuang Meng, Lin Ju, Lei Liang...
TL;DRAntBatchInfer 是一种针对非专用集群进行优化的弹性离线批量推理框架,通过提供多级容错能力和改进推理效率的方法,稳定高效地执行复杂的单模型和多模型批量推理任务,并在稳定性和效率方面表现优越。