- 基于合成数据的音乐标签训练研究
探讨使用合成数据集在标签系统中的应用,研究发现将合成数据集添加到 GTZAN 训练集并不能提高性能,而领域自适应和迁移学习策略可以提升准确度,为未来研究提供了有益的参考。
- ECCV遮挡感知的无缝分割
通过引入一种新的任务 ——Occlusion-Aware Seamless Segmentation (OASS),本研究同时处理全景图像的视野拓宽、场景理解的遮挡感知预测和视域适应等挑战,并提出了一种名为 UnmaskFormer 的解决 - M2QA:多领域多语言问答
通过引入多领域多语言问题回答基准 M2QA,并利用其探索经过微调的模型、最新最先进的 LLM 的跨语言跨领域性能,以及研究模块化方法对领域和语言进行适应,我们发现模型类别内在领域 - 语言组合上具有相当大的性能差异,并且在所有模型规模上源语 - 应用 LLMs 对非正式对话的 ASR 候选解进行再评分:领域适应和上下文传递的影响
大语言模型已成功应用于重新评分自动语音识别假设,本研究揭示了它在非正式谈话中重新评分自动语音识别假设的能力,证明了 Llama2 在 CHiME-7 远程 ASR 任务上的优越性。
- 去噪作为适应性问题:图像恢复的噪声空间域自适应
通过扩散模型在噪声空间中进行域适应,我们展示了一种针对深度学习图像修复的方法,其通过利用多步去噪过程受辅助条件输入影响的独特属性,逐渐将合成数据和真实世界数据的修复结果对齐到一个共同的干净分布。
- 超声心动图分割的域自适应方法基于强化学习
采用强化学习模型 RL4Seg,克服医学图像领域域适应性问题,实现准确率 99%,生成具有解剖学可行性的分割图像。
- 学习概念转变时:混淆、不变性和降维
基于观测数据的领域自适应问题,通过线性结构因果模型和表示学习方法,研究使用不变的协变量表示来解决概念漂移和改善目标预测的可行性,并通过在 Stiefel 流形上约束优化来证明大多数局部最优解与不变的线性子空间一致。通过验证实现方法和理论的三 - 词汇的重要性:什么影响了摘要的领域适应性?
通过分析训练数据中的 ` 词汇 ' 对总结任务的具体影响,本文研究细粒度因素对于领域适应性能的影响,并提出将数据集学习难度量化为生成式总结的学习难度,并得出跨域重叠与总结任务的性能增益之间存在近似线性关系的实验结论,从而实现对未知领域数据集 - 日本医学问答中的 70B 参数大型语言模型
通过使用多个 70B 参数的大型语言模型以及日本医学问答数据集进行指导调整,我们首次展示了指导调整显著提高了日本医学领域的语言模型在解决日本医学许可考试方面的准确性,超过了 50%。特别是,与英文为中心的模型相比,以日语为中心的模型在通过指 - Llama3-70B-Instruct 的领域适应:连续预训练和模型合并的综合评估
在金融监管数据集上,我们对 Meta-Llama-3-70B-Instruct 模型的领域适应性进行了广泛的实验,探索其在通用和特定领域基准上的性能。我们关注了持续预训练(CPT)和模型合并,旨在增强模型的特定领域能力,同时减轻灾难性遗忘。 - 半监督异构领域自适应中的解耦与伪标签
通过 SHeDD(Semi-supervised Heterogeneous Domain Adaptation via Disentanglement)这一端到端的神经网络框架,利用标记和未标记的来自不同数据源的数据,本研究旨在解决半监督 - 学习发现知识:一种弱监督部分领域适应方法
本文介绍了一种简单而有效的基于自适应学习的域自适应方法,称为自适应迁移分类器学习(SP-TCL),用于解决弱监督下的部分域自适应问题,通过精心设计的损失函数发现准确知识并在遵循自适应学习方案下从源域中迭代地排除示例,实现了目标域的成功适应, - 利用无需源数据主动域自适应和一种新的多中心数据集提升 UWF-SLO 血管分割
利用基于补丁的主动领域适应方法改进了超广角扫描激光眼底镜成像中船体分割的准确性,在多个医疗中心的数据上验证了方法的有效性和鲁棒性,并构建了用于交叉中心评估的首个多中心超广角扫描激光眼底镜血管分割数据集。
- 预算内上下文学习:命名实体识别案例研究
在有限的预算内,本研究通过研究不同方法选择样本进行注释,发现少样本内上下文学习(ICL)可以在命名实体识别(NER)任务中实现与使用完整训练集相当的结果,而随机选择样本进行注释可以获得出乎意料的良好性能,并且多样化的注释池与性能的提升相关, - EarDA: 面向准确和数据高效的佩戴式耳机活动感知
基于领域适应技术的 EarDA 系统,能够从不同传感器位置提取独立于领域的特征,同时采用基于过滤器的数据处理方法来减轻头部运动对活动识别的影响,实现更加高效准确的活动感知,优于无领域适应方法的 43%。
- 先自主训练再转录
研究表明,对于训练和测试领域不匹配的情况下,当前的语音识别系统会显示出较大的性能下降。自我训练方法可以帮助解决这个问题,并在域漂移的情况下使模型适应。本文调查了在测试集上进行噪声学生教师训练作为测试时自适应方法的效益,类似于语言模型的动态评 - KDDADSNet:广告中基于自适应孪生网络的跨领域 LTV 预测
利用 ADSNet 方法,通过使用外部数据扩展购买样本的规模,并提升广告平台的生命周期价值(LTV)预测模型,从而解决了真实世界 LTV 数据稀缺性所带来的问题。
- 基于领域适应的荧光光谱解释的深度学习
该研究提出了一种新方法,利用预训练的视觉模型进行领域适应,并结合新的可解释性算法,以解决荧光光谱数据(尤其是激发 - 发射矩阵)分析中的挑战。通过对特定特征工程的神经网络的描述,我们现在能够更深入、更有意义地理解数据背后的物理化学过程。该方 - 朝向领域自适应的神经上下文赌博
通过从源域收集反馈,我们介绍了第一个用于情境强盗的通用领域适应方法。我们的方法在跨领域适应时维持亚线性遗憾界限,并在真实世界数据集上表现优于现有的情境强盗算法。
- IJCAIELF-UA: 有效的无标签用户自适应注视估计
在用户自适应的 3D 凝视估计中,论文提出了一种无标签数据的高效自适应模型,仅使用少量目标用户的未标记图像进行模型适应,通过应用元学习方法和领域自适应的损失函数,实现了在凝视估计中对目标用户进行个性化适应的有效方法。