- 斯坦福 MLab 参加 SemEval-2023 任务 10:探索基于 GloVe 和 Transformer 的可解释在线性别歧视检测方法
本文讨论了我们在 SemEval-2023 任务 10 中应用的方法:实现在线性别歧视的可解释检测。我们进行了三个分类任务以预测文本是否具有性别歧视,将性别歧视文本分类为子类以提供其他解释。我们尝试了许多不同类型的模型,包括 GloVe 嵌 - 基于对比学习的节点表征简化框架
本文研究如何将对比学习与图神经网络相结合,通过简单的列处理嵌入矩阵来提高节点嵌入的质量,从而在分类任务中取得高达 1.5%的改进和超越 8 项基准测试中的现有最先进方法。
- 基于角度的梯度下降动态学习率
提出了一种新颖而简单的自适应梯度下降方法,使用当前梯度和新梯度之间的角度代替传统方法中的梯度期望,通过角度历史记录确定更好的自适应学习率,从而比现有的最先进的优化器在大多数数据集上实现更高的准确性,并证明了该方法的收敛性。
- LAHM:用于多领域和多语言仇恨言论识别的大型注释数据集
本文介绍一种新的多语言仇恨言论分析数据集,涵盖了英语、印地语、阿拉伯语、法语、德语和西班牙语等六种语言,针对辱骂、种族主义、性别歧视、宗教仇视和极端主义等五大领域进行多角度分类,采用多任务学习方法对数据进行测试,以期提高仇恨言论检测和分类的 - 惰性学习:一种受生物启发的可塑性规则,用于快速、高效的突触可塑性
本文介绍了一种受人类学习模式启发的方法:懒惰学习,通过只在分错的样本上进行学习,可实现一些分类任务的更高准确度,并且不需要超参数调整。
- 超越图卷积网络:一种解释性的以正则化为中心的优化框架
本文主要研究在图数据上检测拓扑和语义结构,提出了一种名为 tsGCN 的图卷积网络,通过可解释的正则化优化框架,成功减少了计算无限阶图卷积的高计算复杂度,并且在八个公共数据集上对分类任务取得了比同类竞争对手更卓越的性能。
- 人类和语言模型中的任务歧义
研究语言模型在模糊任务中的表现,提出新的 AmbiBench 测试集进行评估,并发现 175B 参数的模型和使用人类反馈数据进行训练可以在模糊分类任务上超过或接近人类的准确度,但仅有其中一个是不足的。同时,通过在少量模糊上下文示例上微调,可 - POPNASv3: 一种用于图像和时间序列分类的 Pareto-Optimal 神经架构搜索解决方案
本文介绍了 Pareto-Optimal Progressive Neural Architecture Search (POPNASv3) 的第三个版本,这是一个新的顺序模型优化 NAS 算法,旨在针对不同的硬件环境和多个分类任务。我们的 - 监督式语言模型微调的小样本场景距离度量损失函数
本文研究了距离度量学习 (Distance Metric Learning,DML) 损失函数对用于分类任务的语言模型有监督微调的影响。在实验中,我们使用 SentEval Transfer Tasks 数据集,发现使用 DML 损失函数可 - 如何开始?分析中间模型的潜在价值
通过对一系列英语分类任务的系统分析,本研究表明,可以独立分析考虑目标数据集和作为起点的基准模型的潜在相互训练收益,提出了一种实用且有效的方法来确定如何在实际情况下选择基准模型,同时在此给出了 HuggingFace Hub 每种架构最好的模 - 通过提示进行弱监督的对话理解数据增强
本论文探讨了在缺少数据资源的情况下,利用预先训练好的语言模型进行对话理解中的数据增强的问题,并提出了一种利用弱监督滤波器迭代增强质量的新方法。实验结果表明,在 DailyDialog 和 Facebook 多语言任务导向对话的情感、行为和意 - TEDL: 一种用于分类不确定性量化的双阶段证据深度学习方法
本文提出 TEDL Two-stage Learning 方法,基于 Dempster-Shafer 理论,用来量化深度学习模型在分类任务中的不确定性,通过实验表明,TEDL 与交叉熵相结合、替换 ReLU 为 ELU 可以提高稳定性和 A - TransDrift: 使用 Transformer 建模词嵌入漂移
本文提出了一种基于 transformer 的预测模型 TransDrift 用于保持 word embeddings 与数据分布的一致性,实验证明预测嵌入能够显著提高分类准确性。
- ICLR记忆膨胀:建模标签噪声下的神经崩溃
本文探讨了神经坍塌现象及其在分类问题中的应用,提出了限制表达能力的神经网络模型和误差扩散现象的模型,并证明标签平滑方法可以提高分类任务的泛化能力。
- 可微架构与遗忘搜寻的增量学习
本文提出了一种基于 DARTS 和最先进的增量学习策略的增量学习强基准方法,并将架构搜索的思想扩展到正则化架构遗忘,从而在 RF 信号和图像分类任务中实现性能的显著提升,取得了比现有方法高出 10%的结果。
- SIGIR合作文本生成的判别器选择
本文研究语言模型在生成自然文本时采用协同解码策略,使用三种基于 Transformer 的分类器,并提供用于实验的基于 Monte Carlo Tree Search 的批量实现代码,比较它们在分类准确性、样本质量和计算性能等方面的优缺点。
- 基于低秩特征的双变换矩阵学习用于图像分类
本文提出了一种基于隐含低秩特征提取的双重转换矩阵学习方法,通过在两个方向上将学习的主要和显著特征共同投影到标签空间中,从而避免了单个转换矩阵在处理数据时太过严格所限制的灵活性。实验表明,我们的方法对于处理分类任务特别是在复杂情景下的样本降维 - 通过混淆矩阵和校准将人类预测与模型概率相结合
本文提出了一种将人类和机器学习模型的输出结合起来的算法,使得人类的分类结果和模型的概率结果相互补充,同时考虑模型的置信度,通过在 CIFAR-10 和 ImageNet 数据集上的实验证明,这种人机结合模型能够比单独使用模型或人类结果在分类 - RAFT: 一个现实世界的少样本文本分类基准
该研究论文讨论预训练的语言模型在少量数据情况下完成自然语言处理任务的表现,提出了一种新的用于测量模型在真实世界中应用的少量样本任务的基准测试 RAFT,这个基准测试展示了当前技术存在的困难和挑战,虽然一些分类任务对于普通人来说也很困难,但普 - 罗宾汉与马太效应:差分隐私对合成数据有不同影响
本研究分析了 Differential Privacy 对生成的合成数据的大小和准确性的影响,特别是对于数据中的少数派子群 / 类别。使用 DP 模型(PrivBayes,DP-WGAN 和 PATE-GAN)进行分析,发现 DP 导致生成