BriefGPT.xyz
Ask
alpha
关键词
data format
搜索结果 - 5
Transformer 模型可以实现长度概括,但不具备鲁棒性
使用适当的数据格式和位置编码的组合,本研究首次展示了标准 Transformers 在能够外推到输入长度 2.5 倍的序列长度方面的成功,然而与内分布泛化不同,长度泛化仍然是脆弱的,受到随机权重初始化和训练数据顺序等因素的显著影响,导致不同
→
PDF
5 months ago
局部观察,全局分类:使用 GNNs 识别稀疏矩阵结构
本文介绍了一种使用图卷积网络生成稀疏矩阵结构分类器的框架,能够有效地匹配数据中的矩阵结构与适当的数据格式,同时通过样本和特征来识别矩阵结构,实现了对一系列代表性稀疏矩阵形状的 97% 分类精度。
PDF
a year ago
SPSQL: 基于逐步解析的文本到 SQL 生成框架
本文提出了一种基于管道的 Text2SQL 方法 SPSQL,将任务分解为表选择、列选择、SQL 生成和值填充四个子任务,采用不同的数据格式以提高模型精度,并使用命名实体识别模块和数据增强进行优化,通过实验得出在市场业务数据上的 SPSQL
→
PDF
a year ago
COLING
问一问先行,增强终身语言学习能力
本文提出了一种名为 AQF-RQ 的新型学习方法,包括一种新的数据格式以及一种训练任务,使模型更容易生成与先前任务相对应的伪数据,并在分界清晰和不清晰的情况下对伪数据更具鲁棒性,可以实现与多任务学习只有 0.36%左右的性能差距。
PDF
2 years ago
COLING
相关语言之间基于子词级短语的 SMT 的更快解码
本文研究了基于短语的统计机器翻译框架中不同解码器参数和数据格式的选择对解码时间和翻译准确性的影响,并建议了最佳设置,显著提高解码时间,对翻译准确性影响较小。
PDF
8 years ago
Prev
Next