TL;DR通过使用我们新开发的开源图像 - 文本数据集 “注释的 3D 形状” 来评估一个任务中性的图像描述模型的语用能力,我们发现该模型在开发对比性标题方面具有类似于人类的模式(信息量,简洁性和过度信息性)。
Abstract
Evaluating grounded neural language model performance with respect to
pragmatic qualities like the trade off between truthfulness, contrastivity and
overinformativity of generated utterances remains a challenge i