Jun, 2024

检测法国电视和广播节目中口语互动中话语转换边界的方法

TL;DR在自发交谈中,转换相关区域被定义为话语末尾,互动者可以在不打断当前说话者的情况下接过话语的地方,研究话语末尾性对于探索转换控制的动态非常有用。本文提出了一种自动分类多说话者环境中所述话语为终结式或非终结式的方法。我们在一个法语语料库的广播电视片段中比较了音频、文本和两者的融合方法,并使用预训练的自监督表示进行模型训练。我们对不同的融合策略和不同的上下文大小进行了实验,同时也通过分析多次随机初始化的训练结果的差异来探讨性能变异的问题。我们测得的准确度使得这些模型可以用于大规模转换控制分析。