May, 2024

对 SwissBERT 编码模型进行微调,用于嵌入句子和文档

TL;DR对句子或短文档进行嵌入式编码的编码器模型,用于语义搜索和主题建模。本文介绍了一种专门为此目的微调的 SwissBERT 编码器模型版本,采用对瑞士四种国家语言(德语、法语、意大利语和罗曼什语)进行了预训练,使用对应文章子集的对比学习进行微调,实验证明 SentenceSwissBERT 在瑞士特定环境下的文档检索和文本分类任务中表现对原始 SwissBERT 模型和可比基准模型的准确性。该模型可供研究使用。