Feb, 2022
悟空:一个亿级中文跨模态预训练基准
Wukong: A 100 Million Large-scale Chinese Cross-modal Pre-training Benchmark
Jiaxi Gu, Xiaojun Meng, Guansong Lu, Lu Hou, Minzhe Niu...
TL;DR本文发布了一个名为 Wukong 的大规模中文跨模态数据集,旨在用于不同模态的预训练方法基准测试以促进 VLP 研究和社区发展,并通过扩展实验以及不同下游任务的基准测试验证了该数据集的有效性。