ACLApr, 2020

选择适合的工具:匹配模型和实例的复杂度

TL;DR为了更好地优化给定的推理预算,我们提出了一种改进的上下文表示微调方法,它允许神经网络在简单实例中早期 (快速) 地进行神经网络计算,并允许在困难实例中晚期 (准确) 地退出,以交换精度和推理速度,而不需要昂贵的计算资源。