BriefGPT.xyz
Ask
alpha
关键词
large-scale image datasets
搜索结果 - 4
类别级别微调:在带有部分标签的多标签图像分类中抵制错误的伪标签
提出了一种名为类别 - wise 微调(CFT)的新方法,旨在通过使用非伪标签对训练模型进行微调来减少由错误伪标签引起的模型不准确性,并且应用于不同方法和方案训练的模型上取得了令人瞩目的结果和普适性,成为分类模型开发的重要方法。
PDF
5 months ago
高效图像探索与用户引导图像标题生成的视觉分析
运用预训练的大规模语言 - 图像模型,本文尝试解决可视化分析中的两个问题:大规模图像数据集的高效探索与潜在数据偏差的发现以及图像标题的评估与生成过程的引导。通过分析从语言 - 图像模型自动生成的图像标题,我们能深入了解视觉内容的语义基础,并
→
PDF
8 months ago
Flickr 非洲:大规模人类中心的视觉数据中的地理多样性研究
通过对非洲国家的地理标记的 Flickr 图像进行大规模分析,研究表明标准的互联网数据收集方法在低收入和中等收入国家存在局限性,需要进一步努力来捕捉非洲人和他们环境的图像数据,以改善计算机视觉模型在全球范围内的适用性。
PDF
a year ago
基于文本条件的语境化头像生成用于零样本定制化
本文提出了一个零射击的管道,该管道可以通过捕捉用户的身份以令人愉悦的方式进行头像生成,具有个性化的图像生成特征,此外,作者使用大规模图像数据集学习人类 3D 姿态参数,克服了动作捕捉数据集的局限性。
PDF
a year ago
Prev
Next