Nov, 2023

迷你是上品:捷克行业应用语义嵌入模型

TL;DR该研究侧重于开发和评估小型捷克句子嵌入模型,通过替代方法进行预训练、知识蒸馏和无监督对比微调来克服标记数据有限的问题,并展示了这些模型在捷克搜索引擎Seznam.cz中的实际应用,取得了比常规模型更小8倍和更快5倍的竞争性性能。