BriefGPT.xyz
Ask
alpha
关键词
train-test splits
搜索结果 - 4
EMNLP
基于潜在特征的数据划分方法改善泛化评估:仇恨言论检测案例研究
通过对现有数据集的新的训练 - 测试分割,我们挑战了仅基于目标和关键词训练、评估仅考虑训练和测试数据之间的分布变化的仇恨言论模型。我们提出了两种分割变体,并使用四个预训练模型应用于两个数据集,揭示了模型在潜在空间中的盲点上的灾难性失败。进一
→
PDF
8 months ago
划分很重要:用于提升 GNN 性能的扁平极小值方法
研究神经网络中的 “平坦最小值” 问题,确定并探讨适用于非独立同分布数据的方法,并在图神经网络上进行实验,发现使用 “平坦最小值” 方法可以提高 GNN 模型的性能超过 2 个百分点,并推荐实践中使用加权平均技术(EWA)的早期停止时,建议
→
PDF
a year ago
ACL
(不) 解决形态变化:词形重叠人为地提高了模型的性能
使用基于词元的训练 - 测试分割方法重新评估形态学屈折模型,结果表明对于不同的语言模型的泛化性能有着不同程度的影响,尤其对于低资源语言的影响更大。
PDF
3 years ago
ACL
使用自适应赌博算法快速鉴定最新模型的 FIESTA 方法
FIESTA 是一种模型选择方法,借助统计学中的赌博机理论根据多种数据集划分和随机种子选择评估每个模型,从而相对减少计算资源,此方法成功应用于情感分析的模型选择。
PDF
5 years ago
Prev
Next