BriefGPT.xyz
大模型
Ask
alpha
关键词
multilingual training data
搜索结果 - 3
Bailong:基于 QLoRA 和 Zip-tie 嵌入的双语迁移学习
我们结合参数高效调整和高级嵌入初始化技术,通过对英语主导的开源大语言模型进行二次预训练,以提高其在繁体中文上的表现,并进一步引入评估平台来检验模型与人类偏好和指令遵循能力的一致性。我们的评估结果显示,我们的模型在多轮对话任务中相比其他类似的
→
PDF
3 months ago
比较多语言训练的偏差及其影响
本论文对多种语言进行偏见分析,研究多语言数据训练与单语言数据训练对 Bias 的影响并使用情感分析模型来观察不同民族是否被更正面地看待,结果发现多语言 Finetuning 导致对保护群体的预测变异性增加,表明了 Bias 的放大效应。
PDF
a year ago
ACL
跨语言迁移学习用于多语言任务导向的对话
本文讨论了在任务导向的对话系统中如何识别用户意图和相应的插槽,并通过多种跨语言转移方法进行数据集训练比较
PDF
6 years ago
Prev
Next