EMNLPNov, 2023

量化韵律与文字之间的冗余性

TL;DR语调在某种程度上与言语本身及其前后的上下文的信息重复,但仍然包含超越语言的信息。使用大型语言模型,本研究通过英文有声读物中提取的韵律特征与 LLMs 嵌入之间的预测性比较,发现多个韵律特征(包括强度、持续时间、停顿和音调曲线)与言语的信息具有高度的冗余性。然而,仅通过文本无法完全预测语调特征,进一步暗示了语调包含超越言语的信息。