- CVPR歧义标注:何时不是行人?
通过排除高度模棱两可的数据,在自动驾驶数据集的标注中探究标注的模糊性,可以提高最先进行人检测器的模型性能,从而节省训练时间和标注成本,并确保训练数据的代表性。
- 大型语言模型中的子人口结构发现作为数据集分析师:以 LLM 为例
探索数据集的子群体分布并应用于各种下游任务,介绍了子群体结构的概念及其在大型语言模型中的分析框架以及应用于数据集子群体组织、子群体迁移和切片发现等任务的完整工作流程。
- 无人机数据集轨迹预测研究的预处理和评估工具箱
为了简化比较分析,本论文强调了标准化特定数据集在自动驾驶车辆行为预测算法研究中的使用,并提出了一套工具和实践方法。通过广泛经验和综述当前文献,我们总结了一套预处理、可视化和评估的建议,形成了一个开源工具箱,供研究轨迹预测问题的研究人员使用。 - 基于场景和能力驱动的数据集开发与评估:无地图自动驾驶情景下的一种方法
我们提出了一种基于场景和能力的数据集开发方法,通过 ISO 21448 和 ISO/TR 4804 的原则,便于结构化地推导出数据集需求,从而克服了现有车道检测数据集在真实世界适用性、关键特征标注和复杂驾驶操作全面信息缺失等方面的显著局限性 - 非结构化户外环境中感知数据集调研
感知是野外机器人管道的重要组成部分。本综述在比较在非结构化户外环境中公开可用的数据集。我们关注野外机器人常见感知任务的数据集,对可用的研究数据集进行分类和比较。本综述还报告了相关数据集特征,以帮助从业者确定哪个数据集最适合他们自己的应用。我 - 一款全面易用的多领域多任务医学影像元数据集(MedIMeta)
通过将机器学习技术与医学图像分析领域相融合,本研究介绍了一种名为医学图像元数据集的新型多领域、多任务元数据集,该元数据集包含 19 个医学成像数据集,涵盖 10 个不同领域和 54 个医学任务,并且采用相同的格式标准化,可在 PyTorch - CVPRCAGE:环绕情感引导的表达推断
本研究通过深入比较 AffectNet 和 EMOTIC 两个数据集,提出了一种基于连续 valence 和 arousal 标签的面部表情预测模型,通过将离散类别标签与连续情绪标签结合,显著改善表情推断的性能,取得了在 AffectNet - 自动驾驶中的协同感知数据集调查
本研究综述了车辆对基础设施(V2I)、车辆对车辆(V2V)和车辆对一切(V2X)的协作感知数据集,重点关注用于自动驾驶车辆感知任务的大规模基准的最新发展。该论文系统地分析了各种数据集,比较了它们在多样性、传感器设置、质量、公开可用性和对下游 - COLING如何在关系分类中编码领域信息
当前的语言模型需要大量的训练数据才能获得高性能。对于关系分类(RC),许多数据集是特定领域的,因此将数据集合并以获得更好的性能是非常复杂的。我们探索了一种多领域训练设置用于 RC,并尝试通过编码领域信息来提高性能。我们提出的模型相对于基线设 - 探索在驾驶数据合成中的生成式人工智能应用
通过三种不同的生成式人工智能方法应用驾驶模拟器中的语义标签图作为创建真实数据集的桥梁,本文比较分析了这些方法的图像质量和感知能力,产生了包括驾驶图像和自动生成的高质量注释的新合成数据集,证明了扩散式方法可以提供改进的稳定性和解决 Sim2R - COLINGnEMO:波兰情感语音数据集
该研究介绍了 nEMO,一个包含波兰语情感语音的新型语料库,它由参演的九名演员录制的三个多小时的样本组成,描绘了六种情感状态:愤怒、恐惧、快乐、悲伤、惊讶和中性状态。
- OPSD:一种冒犯性波斯社交媒体数据集及其基准评估
该研究介绍了两个针对恶意评论和冒犯性言论的数据集,并使用先进的语言模型和机器学习算法进行了实验,以建立该数据集的基准,结果表明 XLM-RoBERTa 在该数据集上的 F1 分数分别为 76.9% 和 89.9%。
- PORTULAN ExtraGLUE 数据集和模型:启动葡萄牙语神经处理基准测试
借助对葡萄牙语神经模型的研究,我们提供了一套用于多种语言处理任务的数据集合,以及针对这些下游任务进行细调的神经语言模型集合。通过使用最先进的翻译引擎将数据集从英语机器翻译成葡萄牙语,以与文献中的主流基准相结合,启动了葡萄牙语的对应数据集。由 - 偶然输入条件下的在线学习:综合评述与分析
在线学习中处理无序输入的方法和数据集的分类,评估以及对数据集不平衡性的度量,附带了代码实现和碳足迹的介绍。
- 使用以前未见的神经架构搜索数据集的洞察
神经网络、深度学习、神经架构搜索、数据集、NAS 挑战是研究论文的关键词,该论文介绍了为一系列 NAS 挑战创建的八个数据集,以及使用标准深度学习方法和挑战参与者的最佳结果进行的实验。
- 数据代理:评估大型语言模型对无标注、自然语言查询的回答能力
评估了 OpenAI 的 GPT-3.5 作为一种 “语言数据科学家”(LDS) 的能力,通过评估其在多个标准上的性能,包括与诸如 NumPy、Pandas、Scikit-Learn 和 TensorFlow 等库相关的数据科学代码生成任务 - 你来自哪里?让我猜猜!索拉尼库尔德语言言尔识别
通过进行现场访问与记录,我们获得了 6 个次方言的 29 小时、16 分钟和 40 秒的音频记录,应用了三种深度学习模型(ANN,CNN 和 RNN-LSTM),并比较了它们的性能,发现 RNN-LSTM 模型表现最佳,准确率达到 96%。
- RealKIE: 为企业关键信息提取设计的五个新数据集
RealKIE 是一个具有五个具有挑战性数据集的基准测试,旨在推进关键信息提取方法,重点关注企业应用。这些数据集包括一系列不同类型的文档,包括 SEC S1 文件,美国保密协议,英国慈善报告,FCC 发票和资源合同。除了介绍这些数据集外,我 - TFB:面向全面和公正的时间序列预测方法基准化
提出了一个自动化的时间序列预测(TSF)方法基准(TFB),通过解决数据集、比较方法和评估流程方面的不足,推动了时序预测方法的研究进展,包括数据领域覆盖、对传统方法的偏见以及评估流程的不一致和不灵活性。
- 通过对比词对来消除句子嵌入器的偏见
去除自然语言处理中句子嵌入中的线性和非线性偏见信息,以不影响下游性能。通过比较常见去偏方法和考虑非线性信息的去偏指标,探索了这种方法。