Mar, 2020

针对 TED 演讲的浅层言语注释

TL;DR本文介绍了一种基于 Penn Discourse TreeBank 标注语言相关特征的新资源,通过对 TED Talks 进行标注,为中英文翻译和语言技术的发展做出了贡献。该资源注重对计划性口语独白的篇章层面语言特征的标注,而不仅仅局限于书面语,基于多位标注者的协商,该标注方案的可靠性得到了证实。