Omniglot 挑战:三年进展报告
本研究使用深度神经网络和度量学习的思想,建立了一种学习新概念的框架,从而不需要微调以适应新的类别类型,并在视觉和语言任务中定义了一次性学习问题,实验结果表明,在 Imagenet 数据集上,准确率从 87.6% 提高到 93.2%,在 Omniglot 数据集上,准确率从 88.0% 提高到 93.8%。
Jun, 2016
提出了新的任务定义、数据集和评估指标,包括标准和开放词汇检测以及引用表达式。OmniLabel 是具有挑战性的基准,具有多样化的复杂对象描述,并且是一个自然的开放词汇环境下的难点。评估使用经过修改的平均精度度量,通过评估强大的基线来验证.
Apr, 2023
通过使用 OmniACT 数据集和基准测试,该研究介绍了评估代理程序生成可执行计算机任务的能力的一种新方法,并展示了当前最强的基线语言模型代理(GPT-4)在该基准测试中表现最好。然而,与人类能力相比,它仅达到 15%,这突显了传统网络代理在生成可完成任务的可执行脚本方面的挑战。该基准测试为衡量和评估语言模型代理在自动化计算机任务方面的进展提供了平台,并激励未来研究努力构建大型语言模型和计算机屏幕的视觉基础的多模态模型。
Feb, 2024
本文介绍了 Meta Omnium 数据集,并使用其来评估少样本元学习算法的能力,实验证明 Meta Omnium 可用于学习各种视觉任务,是一个用于元学习研究的有用工具。
May, 2023
本研究提出一种新颖的跨语言转移方法,使用神经编码器 - 解码器模型完成词形映射任务,并使用高资源语言数据提高低资源语言的性能。在 21 种不同语言家族的语言对中进行实验,比无转移方法的精度高出 58%,并表明零射和单射学习也是可能的。此外,我们发现语言相关性程度强烈影响转移形态学知识的能力。
Mar, 2017
本文提出一种基于多模态预训练的语言条件检测框架,能够通过自然语言作为知识表示从不同的数据集中积累 “视觉词汇”,解决多数据集训练中的技术难题,并成功应用于超过 35 个目标检测任务,取得最新成果。
Sep, 2022
本文描述了 SIGMORPHON 2023 共享任务的基线系统,利用 Transformer 架构并将文本生成视为序列标注任务,旨在自动化语言文献编制过程,以节省注释者的宝贵时间和精力。
Mar, 2023
本文提出一种高效和准确的多任务学习方法,应用于艺术领域,并证明其在艺术数据上优于手工特征方法和卷积神经网络。此外,我们还提出了一个类似挑战性质的数据集,以激发更多的研究和社会参与。
Aug, 2017
该研究运用天赋先验直接模拟人类在抽象视觉任务(例如字符 / 涂鸦识别)中的基本天赋先验,使得机器学习可以在类似于人类只使用很少的样例和预训练的情况下进行泛化,并保持和人类人类识别率相同。
Jan, 2022
本文旨在为多语言学习提供潜在的架构改进,通过开发一种名为 Polyglot Prompting 的学习框架,利用提示方法为不同的语言和任务学习一个统一的语义空间进行多语言多任务基于提示的学习,以实现跨语言的互助和更全面的实验评估,开创了未来多语言研究的新方向。
Apr, 2022