BriefGPT.xyz
大模型
Ask
alpha
关键词
multilingual performance
搜索结果 - 5
1+1>2:大型语言模型能否用作跨语言知识聚合器?
通过从不同语言中汇集知识,该研究介绍了一种增强大型语言模型在多语言环境下性能的方法。实验证明,该方法显著提升了性能,特别是在减少语言性能差异方面。
PDF
14 days ago
弥补鸿沟:提升 LLM 多语言表现的动态学习策略
通过优化 LLM 的提示策略、使用混合方法融合 LLM 检索增强生成和多语言嵌入,以及动态选择最佳提示策略、LLM 模型和嵌入模型,我们提出了一种能够显著提高多语言能力的新技术。
PDF
a month ago
多语言推理中问题翻译训练的力量:扩大范围与深化见解
在这篇论文中,我们研究了如何利用问题对齐方法提高大型语言模型在非英语性能上的应用,通过对可执行代码推理和常识推理的影响进行探索,并通过代理调整的方式实现对极大型语言模型的高效应用。多语言推理基准测试结果显示,问题对齐方法能够在不同推理场景、
→
PDF
2 months ago
多语言场景的渐进式视觉语言知识蒸馏和对齐框架
我们提出了一个概念简单但有效的多语言 CLIP 压缩框架,并训练了一个轻量级的多语言视觉 - 语言模型 DC-CLIP,用于中文和英文环境。在零样本图像分类方面的综合实验表明,相比于现有的类似参数规模的模型,DC-CLIP 在英文环境中取得
→
PDF
3 months ago
语言模型标记器引入了语言之间的不公平性
研究显示,语言模型在处理不同语言时存在标记化差异,导致部分语言社区无法公平访问商业语言服务、处理时间和网络延迟,并限制了模型学习的上下文,因此建议使用多语种公平标记器来训练未来的语言模型。
PDF
a year ago
Prev
Next