Jan, 2024

中文数据处理之翘楚:英文代码模型

TL;DR使用基于代码的大型语言模型在非编码汉语任务中可显著提高性能,特别是对于对汉语幻觉敏感的任务,语言学特征较少的模型表现更好,我们的研究还对哲学“中国屋”思想实验提供了独特的观点。