零样本跨语言实体链接中的跨语言转移

ACLOct, 2020

零样本跨语言实体链接中的跨语言转移

Cross-Lingual Transfer in Zero-Shot Cross-Language Entity Linking

Elliot Schumacher, James Mayfield, Mark Dredze

TL;DR提出了一个基于多语言 BERT 表征的神经排名体系结构，用于跨语种实体链接，发现 BERT 的跨语种能力在单语和多语环境下都具有强大的性能；此外，研究了零 - shot 语言转移，提出了辅助训练目标，缓解了部分错误，但发现剩余的错误可以更好地归因于领域转移而不是语言转移。

Abstract

cross-language entity linking grounds mentions in multiple languages to a single-language knowledge base. We propose a neural ranking architecture for this task that uses →

cross-language entity linking neural ranking architecture multilingual bert zero-shot language transfer domain shift

发现论文，激发创造

参数选择性持续测试时间适应

本文引入了 Parameter-Selective Mean Teacher (PSMT) 方法，通过选择性的蒸馏机制在学生模型中利用过去知识对新知识进行正则化，以减轻错误积累的影响；同时，在教师模型中通过 Fisher 信息创建掩码来有选择性地更新参数，并应用保存措施于关键参数，以避免灾难性遗忘，实验证实 PSMT 在多个基准数据集上优于现有方法。

Jul, 2024

通过使用模拟数据来减少数据采集和标记以进行缺陷检测

使用合成数据与未标注的真实数据进行训练可在较低成本下实现与标注真实数据相媲美甚至更好的缺陷检测结果。

Jun, 2024

基于伪标签的领域适应用于零样本文本隐写分析

本文提出了一种基于伪标签和领域适应（无监督学习）的跨域文本隐写分析方法（PDTS），通过使用预训练的 BERT 和单层 Bi-LSTM 来学习和提取任务间通用特征，并生成特定任务表示。通过选择性特征传播来增强分类性能，并通过自训练使用未标记的目标领域数据和伪标签来训练模型。实验结果表明，我们的方法在零样本文本隐写分析任务中表现出色，在没有目标域标记数据的情况下实现高检测准确率，并优于当前的零样本文本隐写分析方法。

Jun, 2024

基于聚类的领域泛化验证划分

该论文考虑了域漂移下的模型选择问题，并提出了一种基于核 k-means 聚类的数据分割算法，该算法最大化训练集和验证集之间的最大平均差异 (MMD)，提高选定模型的泛化能力，该技术在一系列数据集和训练算法中一直表现优于其他分割策略，适用于域广义化和无监督域适应任务。分析还表明，训练集和验证集之间的 MMD 与测试域准确性强烈相关（$\rho=0.63$），进一步证实了这种方法的有效性。

May, 2024

DiffuBox：基于点扩散的三维物体检测优化

通过引入一种新颖的基于扩散的边界精化方法，利用激光雷达点环绕粗糙边界框的无域扩散模型来同时精化边界框的位置、尺寸和方向，克服了现有模型在应用于具有不同传感器设置或地理位置的领域时面临的性能不稳定问题，从而在不同数据集、目标类别和检测器上实现了显著的改进。

May, 2024

Swin Transformer 的自监督跨模态预训练

通过增强 Swin Transformer，我们的模型 SwinFUSE (Swin 多模态融合的无监督增强) 在医学影像领域从不同的影像模态中学习，提升了下游性能，并展现出了对领域变化的适应性以及显著的泛化能力。

May, 2024

多功能教师：一种面向跨领域适应的课程感知教师 - 学生框架

在跨领域目标检测中，本文引入了一种名为 Versatile Teacher (VT) 的新型教师 - 学生模型，通过考虑类别特定的检测难度并采用两步赋值机制，生成更可靠的伪标签，将其作为显著性矩阵来引导区分器进行有针对性的实例级对齐，取得了有希望的实验结果，并扩展了广泛使用的一阶检测器的对齐方法，具有重要的实际应用潜力。

May, 2024

不完整调性下的群体间单细胞数据联合分析

跨群体整合多组学单细胞数据的新方法，通过学习统一细胞表达，实现无需全模态参考样本的跨域关系和特征填充，为单细胞聚类、分类和特征填充等任务提供了稳健的解决方案。

May, 2024

应用信息瓶颈解决任务导向通信中的分布偏移问题

在这篇论文中，我们提出了一种基于信息瓶颈原理和不变风险最小化框架的新方法，旨在提取紧凑且信息丰富的特征，以具备对领域转移和语义转移具有强大泛化能力的同时，在传输过程中保持紧凑性。我们在图像分类任务上的大量模拟结果表明，该方案优于当前的最先进方法，并实现了更好的率失真权衡。

May, 2024

PARDEN，你能重复一遍吗？通过重复防御越狱

本文提出了一种名为 PARDEN 的方法，通过要求模型重复自己的输出来检测和减少 Large Language Models（LLMs）的安全风险，该方法在监测入狱风险方面明显优于现有方法。

May, 2024