Sep, 2018

自言自语:自对话作为对话代理的数据

TL;DR本文提出了一种新方法 —— 通过众包自对话方式高效地收集主题上的非结构化对话数据,并提供包含 23 个主题的 360 万词汇量的语料库,通过与其他语料库的比较证明了其实用性。