Apr, 2024

基于扩散排序的 3D 字幕观点选择

TL;DR利用 DiffuRank 方法解决了在 3D 物体描述中产生错觉的问题,通过排名评估 2D 渲染视图与 3D 物体之间的对齐,提高了标题的准确性和细节,并在多个数据集上验证了其适用性。