BriefGPT.xyz
大模型
Ask
alpha
关键词
multitask models
搜索结果 - 4
Arcee 的合并工具包:一个用于合并大型语言模型的工具包
采用开源语言模型、迁移学习和模型合并技术,通过创建多任务模型提升性能和应用领域的研究。为了支持这一领域的发展,推出了名为 MergeKit 的开源库,该库提供了一个可扩展的框架,便于在任何硬件上高效合并模型。
PDF
3 months ago
联合语音翻译和命名实体识别
本篇论文提出了多任务模型将直接语音翻译和命名实体识别相结合,并与传统串行方法进行了对比,在不降低翻译质量的情况下,在命名实体识别任务上显著提高了性能。
PDF
2 years ago
AAAI
ATOMIC: 机器常识图谱用于 If-Then 推理
ATOMIC 是一种以常识推理为组织形式的图表,其中包括了 877k 个基于变量的 if-then 关系类型,使用这种类型,神经模型可以获得简单的常识能力并进行推理,证实了将多任务模型引入到 if-then 关系结构中可以得到比独立训练的模
→
PDF
6 years ago
ACL
神经语音翻译的绑定多任务学习
本文探讨了用于神经语音翻译的多任务模型,并对其进行增强,以反映两个直观概念。精准的中间表示和神经关联的模式,参与模型的训练可以提高低资源语音转录和翻译任务的性能。
PDF
6 years ago
Prev
Next