Feb, 2024

中文心理 BERT:面向社交媒体的中文心理健康文本分析的领域自适应预训练

TL;DR本研究针对心理学领域缺乏定制的预训练模型,从中国社交媒体平台收集了 3.36 百万条文本,并加入心理学词典进行预训练改进,通过自适应训练开发出专门用于心理领域的模型,实验结果表明该模型在四个公共基准测试中表现优越且能够做出心理相关的预测。因数据隐私担忧,数据集不对公众开放,但预训练模型和代码可通过指定的链接公开获取。