Apr, 2024

AntBatchInfer:Kubernetes 集群中的弹性批量推断

TL;DRAntBatchInfer 是一种针对非专用集群进行优化的弹性离线批量推理框架,通过提供多级容错能力和改进推理效率的方法,稳定高效地执行复杂的单模型和多模型批量推理任务,并在稳定性和效率方面表现优越。