BriefGPT.xyz
大模型
Ask
alpha
关键词
dataset sizes
搜索结果 - 2
GigaSpeech 2:用于低资源语种的演进、大规模、多领域的 ASR 语料库的自动爬取、转写和优化
这篇论文介绍了 GigaSpeech 2,一个为低资源语言设计的大规模、多领域、多语种的语音识别语料库,它不依赖于配对的语音和文本数据。该论文还介绍了一个自动化的数据爬取、转录和标签优化流程,以及通过修改的 Noisy Student Tr
→
PDF
17 days ago
选择何种骨干网络:面向计算机视觉的资源高效领域比较
该研究评估了多个轻量级、预训练的 CNN 骨干网络在各种不同数据集上的性能,包括自然图像、医学图像、星系图像和遥感图像,并提供了关于计算机视觉领域不同骨干网络性能和有效性的可行见解,为模型选择提供指导。
PDF
25 days ago
Prev
Next