offline metrics | BriefGPT - AI 论文速递

关键词offline metrics

搜索结果 - 5

ICCV自动驾驶中 3D 物体检测的离线评估
在本研究中，我们通过对 16 种物体检测模型在 CARLA 模拟器上的大量实验，首次实证评估了不同检测指标对驾驶性能的预测能力。我们发现 nuScenes 检测得分与驾驶性能的相关性高于广泛采用的平均精度指标，并呼吁谨慎依赖新兴的以规划为中
PDF10 months ago
离线强化学习对话评估
本文提出了使用离线强化学习作为对话系统评估的一种方法，该方法基于一个静态语料库。通过训练一个离线强化学习批评家，我们展示了这种评估方法可用于各种类型的对话系统，而且与人类评判具有强相关性。
PDF2 years ago
离线指标能否预测推荐系统的在线性能？
通过在六个受控的模拟环境中对 11 个推荐系统进行评估，研究离线度量是否能够预测在线性能，在观察到离线度量在一定范围内与在线性能相关的同时，还发现离线性能的提高会导致在线性能的收益递减，同时观察到推荐系统的排名取决于初始离线数据量以及探索策
PDF4 years ago
ECCV关于基于视觉的驾驶模型的离线评估
本文探讨了自动驾驶模型评估的方法，发现离线预测误差并不一定与驾驶质量相关，而适当选择验证数据集和适当的离线指标可以显著提高离线评估与驾驶质量的相关性。
PDF6 years ago
NIPS在线广告拍卖中的效用优化成本敏感学习
本文研究计算广告中的关键问题之一：在线广告拍卖中点击率和转化率的预测，分析了前沿的转化建模方法中存在的非均匀误差成本问题，提出基于商业价值权重日志损失的模型训练方法，实验结果表明，该方法可以显著提高模型的离线和在线性能表现。
PDF8 years ago