BriefGPT.xyz
Ask
alpha
关键词
extrapolation capabilities
搜索结果 - 4
基于领域对抗性神经网络的机器学习蒸散发模型的可外推性改进
本研究通过使用领域对抗神经网络(DANN)集成到蒸发蒸腾(ET)模型中,以提高机器学习的水文预测模型的地理适应能力,并通过减少数据分布的差异和避免低准确性预测,显著增强了模型的外推能力。
PDF
a month ago
双石击鸟:双层位置编码实现更好的长度外推
利用自然语言序列的内在分割,设计了一种名为 Bilevel Positional Encoding(BiPE)的新的位置编码方法。每个位置的 BiPE 结合了分段内编码和分段间编码,从而能够捕捉语义信息,并通过相对位置编码来改善外推能力。理
→
PDF
5 months ago
语言模型的数值计算能力:从记忆到计算
该研究调查了语言模型在计算预测和问题解决能力方面的应用,以及其在进行算术计算和内部信息处理方面的推广能力。通过使用二进制加法和乘法作为测试样本,该研究成功地训练了一个轻量级语言模型,并进行了一系列实验以探究其外推能力和内部信息处理过程。研究
→
PDF
a year ago
生成模型中外推独立机制的理论
生成模型可以通过实现真实数据生成过程的因果图结构向未被观测环境进行预测,然而,由于因果图结构节点通常未被观测,这导致了模型的超参数化和因果结构的不可识别性,此文章开发了一种理论框架,通过一个弱化的可识别性标准解决这种情况,并展示经典的随机梯
→
PDF
4 years ago
Prev
Next