EMNLPSep, 2021

BERT 是否学习人类感知?通过词汇了解语言风格

TL;DR本研究通过探究人类感知和机器词汇重要性这两个视角,研究了文本的语言风格对词汇用法的影响,通过收集人类感知数据 Hummingbird 并参考目前常用的 BERT 语言风格分类器,比较了两者对于词汇标签的不同理解。研究表明,对于某些风格,如积极情感和愉悦,人类和机器的识别结果存在显著的重叠,但机器标记某些内容词非风格相关,而人们不能通过这些词汇准确感知对应的风格。