Oct, 2023

有声书的韵律分析

TL;DR对书籍和有声书之间的93对数据集进行处理,从叙述性文本中使用语言建模预测出更好刻画人类有声阅读的语调、音量和说话速度的模型,通过与商业TTS系统的结果进行对比,发现预测的音调与人类朗读的相关性更高,并且预测的音量属性与人类朗读更为相似。最后,通过人类评估研究量化了人们对于语调增强型有声书朗读的偏好程度。