BriefGPT.xyz
大模型
Ask
alpha
关键词
annotation pipeline
搜索结果 - 4
TAVGBench:文本转音频 - 视频生成性能基准测试
提出了一个用于生成文字描述音频视频的基准测试集(TAVGBench),包含超过 1.7 百万个剪辑,总时长达到 11.8 千小时。通过自动注释流程,确保每个音频视频都具有音频和视频内容的详细描述。引入了 Audio-Visual Harmo
→
PDF
2 months ago
细粒度的冠状病毒新闻命名实体
本研究提出了一个数据标注流程,从包括普通和领域特定实体的冠状病毒新闻文章中生成训练数据,并在领域专家手动标注的测试句子上评估训练模型的性能。
PDF
2 months ago
ICCV
光度挑战物体的多模态数据集采集
本文介绍了一个用于增强现有的 3D 感知和 6D 物体姿态数据集的新注解和获取方法,通过机器人前向运动学、外部红外跟踪器和改进的校准和注解过程,提出了一个多模态传感器装置,据此创建了高精度的 3D 数据,有效克服了现有数据集的限制,并为 3
→
PDF
10 months ago
CVPR
ONCE-3DLanes:基于单目图像的三维车道线检测建模
本文介绍了 ONCE-3DLanes 数据集,其中包含 211K 实际道路场景的 3D 车道标注,提出了自动生成高质量 3D 车道位置的数据集注释流程,同时提供了一种新的无锚点,无外部参考的方法 SALAD 来回归图像视图中的车道 3D 坐
→
PDF
2 years ago
Prev
Next