Nov, 2023

使用自注意力模型检测音节级发音重音

TL;DR本文介绍了一种自注意力模型,用于识别英语口语每个音节的重音级别,通过探索音高、强度、持续时间、音节类型和核心(音节的元音)等韵律和范畴特征,将这些特征输入到自注意力模型中,预测音节级别的重音。该研究表明自注意力模型在重音级别检测中具有良好的前景,可以应用于在线会议和英语学习等各种场景。