Apr, 2024

Self-StrAE 在 SemEval-2024 任务 1 中:用更少地让自我结构化自编码器学习更多

TL;DR该论文提出了两个简单的改进措施,一是将重构作为辅助目标包含在词汇中以提高表示质量,二是演示了增加独立通道数量可显著提高嵌入质量,同时减少参数数量,甚至将非嵌入参数总数减少到七的极限。我们的系统可以从头开始使用仅为 1000 万个输入数据进行预训练,并且在英语、西班牙语和南非荷兰语之间都表现出良好的效果。