关键词data selection strategies
搜索结果 - 2
- 构建领域特定的大型语言模型的高效连续预训练
本研究探讨了持续预训练作为开发面向特定领域的大型语言模型的一种替代策略,引入了通过领域自适应持续预训练在金融领域上开发的 FinPythia-6.9B,FinPythia 通过金融任务中持续预训练实现了稳定的改进,并进一步探索了简单而有效的 - ACL多语言少样本转移数据选择的关键是模型中的多样化和不确定性
本文探索了各种数据选择策略,依靠多个度量,利用了渐变嵌入和损失嵌入方法,以提高针对多语言预训练模型的 POS 标记、NER 和 NLI 任务的 Few-shot 迁移的性能。实验证明,所提出的方法始终优于随机数据选择基线,即使仅使用更少的标