- 洁净图像后门攻击
通过未经过修改的标签中的错误标签注入,我们提出了清洁图像后门攻击,揭示了后门仍然可以通过错误标签的一小部分分数进行注入,从而对图像分类模型的公正性和鲁棒性造成严重威胁,需要对外包标注中的错误标签保持警惕。
- 嵌套神经符号法对动作质量评估的研究
使用计算机视觉进行行动质量评估的研究通过神经网络从视频数据中提取可解释的符号,并应用规则进行质量评估。该研究以潜水为案例研究,发现领域专家更喜欢该系统,并认为它比纯粹的神经网络方法在潜水行动质量评估方面更具信息量。该系统还实现了先进的动作识 - 使用动作线索监督低数据环境下的单帧身体姿势和形状估计
使用未标注视频作为监督信号,可以在没有足够的标注数据时提供额外的监督以优化网络权重,并与使用更多标注数据训练的方法相媲美。
- 泛影:面向自动驾驶的全景和可控视频生成
本文介绍了 Panacea,一种创新方法,用于在驾驶场景中生成全景和可控的视频,生成无限多样化的、关键的自动驾驶样本,从而提高自动驾驶技术的先进性。Panacea 通过整合一种新颖的 4D 注意力和两阶段的生成流程来保持一致性,并利用 Bi - EMNLP通过多任务训练和优化训练计划实现高效的语法错误校正
本研究通过使用辅助任务和优化训练顺序,针对神经语法错误校正的问题,提出了一种高效利用数据的方法,利用较小规模的基于 BART 模型(400M 参数)的结果优于基于 T5-XXL 模型(11B 参数)的最佳模型。
- 通过像素级梯度剪裁提升高分辨率三维生成
通过像素级梯度剪裁(PGC)方法,提高现有高分辨率三维生成模型的性能,以改进高分辨率三维物体渲染的综合质量。
- 基于基础模型的少样本全景分割
借助任务不可知的图像特征,我们提出了 SPINO 方法,该方法可以通过仅使用十个带注释的图像来预测高质量的伪标签,从而实现少样本全景分割,同时为基于基础模型的学习复杂视觉识别任务铺平了道路。
- 商用智能语音助理领域分类的主动学习
本研究介绍了一种基于 LSTM 域选择组件的人工智能助理系统中对于选择相关新训练数据的方法,实验结果表明,与随机选择和基于熵的方法相比,在固定标注预算的情况下提供了更高的准确性提升。
- ACL基于有限状态转换器的神经语法错误纠正
介绍了一种基于语言模型和有限状态转换器的语法错误更正方法,与神经序列模型和基于短语的机器翻译相比具有更好的效果,同时无需大量的标注数据,并且在拥有标注数据的情况下,该方法也适用于基于短语的机器翻译。
- 使用已标记和未标记的任务进行多任务学习
本文探讨多任务学习中训练数据标注不完整的情况,并提出了基于实例的信息传递方法,针对固定标注任务和主动选择标注任务两种情况提出了算法,并通过合成数据和真实数据的实验证明了算法的有效性。