BriefGPT.xyz
Ask
alpha
关键词
audio, image, and textual data
搜索结果 - 1
LUMA: 一个用于学习不确定和多模态数据的基准数据集
多模态深度学习通过整合文本、图像、音频和视频等多元信息源增强决策能力。为了开发可靠的多模态方法,了解不确定性如何影响这些模型至关重要。我们介绍了 LUMA 数据集,它是一个独特的基准数据集,其中包含来自 50 个类别的音频、图像和文本数据,
→
PDF
22 days ago
Prev
Next