BriefGPT.xyz
Ask
alpha
关键词
vault
搜索结果 - 2
Vault:一个全面的多语言数据集,用于推进代码理解和生成
The Vault 是一个开源的、大规模的代码文本数据集,具备 10 种流行编程语言的 4000 万个代码文本对,经过清理和处理,可用于训练不同类型的基于代码的大型语言模型,并同时为研究者和实践者提供了数据清理方法和脚本以改善他们的数据集。
PDF
a year ago
ACL
VAULT: 机器阅读理解的可变统一长文本表示
本论文提出了一种基于上下文表示的轻量且并行高效的 MRC 段落表示方法 VAULT,通过使用一种新的基于高斯分布的目标函数训练模型,其关注部分正确的实例的方法,从而克服了现有模型需要复杂模型架构的瓶颈,实验结果表明 VAULT 在处理长文本
→
PDF
3 years ago
Prev
Next