Jan, 2021

tf.data:一个机器学习数据处理框架

TL;DRtf.data 是一个为构建和执行高效机器学习输入流水线而设计的框架,它提供了各种操作符用于定义计算,已经可以应用于不同的机器学习领域。我们展示了输入流水线的性能对于机器学习模型的训练时间至关重要,tf.data 的特性可以避免手动性能优化,实现高效的输入流水线。我们的分析为将计算与存储结合起来,推送数据处理到存储层提供了未来研究方向。