Oct, 2023

提升心理健康领域的长篇文本生成技术:基于任务自适应的分词

TL;DR通过任务自适应分词机制,在心理健康方面增强长文本生成的流程,在多个结果中采样具有可变分词的策略,通过优化基于任务的数据的采样概率,引入了构建专用词汇的策略,并引入了允许将任务特定的令牌集成到预训练模型的分词步骤的词汇合并协议。在对中文和英文的心理问题回答任务进行了广泛实验证明,我们的任务自适应分词方法在生成性能上带来了显著的改进,同时使用的标记量减少了多达 60%。初步实验结果显示,使用我们的分词方法与非常大的语言模型能够取得令人满意的结果。