HotelRec:一种新颖的大规模酒店推荐数据集
MobileRec 是一个大规模的基于 Google Play Store 的数据集,包含了 1900 多万次用户互动和 10K 多种不同类型的应用程序,通过比较研究了几种最先进的推荐方法,MobileRec 可以作为测试应用程序的理想平台,并作为基准线提供量化结果,以供其他研究人员进行比较。
Mar, 2023
本研究旨在为品牌发展提供有益和关键的信息检索任务之一的场所推荐,建立一个全面的数据集,名为 OpenSiteRec。OpenSiteRec 利用异构图模式表示各种类型的真实世界实体和关系,以评估推荐模型在场所推荐任务上的性能。
Jul, 2023
本文提出了针对酒店识别领域中的 Hotels50K 和 Hotel-ID 两个数据集的更新版本,以提供不同难度等级的评估设置,以更好地适应于拟定的真实应用领域,从而在对抗人口贩卖中起到作用。通过多种最先进的图像检索模型对此设置进行测试,结果显示,正如预期,模型性能随着评估逐渐接近真实世界的未知情况而下降。最佳模型排名也会随着不同的评估设置而改变,这进一步推动使用所提出的更新版本数据集。
Jul, 2022
MerRec 是第一个针对 C2C 推荐的大规模数据集,包含用户、产品和时间戳等标准特征,以及商品分类和文本属性等独特元素,通过六个推荐任务的广泛评估,为研究 C2C 推荐算法在实际场景中的发展建立了一个新的基准,弥合了学术界和工业界之间的差距。
Feb, 2024
因为图片质量差,拍摄角度限制,和不同酒店房间相似的物品,从酒店房间的图像中识别出酒店是人口贩卖调查中的一项挑战。为了支持这一任务,我们提供了一个包括 50,000 家酒店中超过 1,000,000 张图像的数据集,并采用了一些数据增强方法,运用标准的网络架构来进行基准测试。
Jan, 2019
本研究回顾了推荐系统在电子商务、电子旅游、电子资源、电子政务、电子学习和电子图书馆等领域的不同技术和发展,并通过分析最近的研究,提供了当前发展的详细概述,识别了推荐系统中的现有困难,为实践者和研究人员提供了必要的指导和见解。
Aug, 2022
smlyaka 团队基于深度卷积神经网络与度量学习构建了一个鲁棒的人工智能系统,这个系统在 Google Landmarks-v2 数据集噪声和多样性较高的情况下表现出更好的识别和检索效果,其包括自动数据清理系统和提高数据区分度的再排序方法,并在 Google Landmark Retrieval 2019 挑战赛中获得了第一名,并在 Kaggle 的 Google Landmark Recognition 2019 挑战赛中位列第三。
Jun, 2019
本文介绍了 TLDR9 +—— 一个从 Reddit 讨论论坛中提取的包含 900 万多个训练实例的大规模摘要数据集,旨在进行极端摘要,并通过人工注释蒸馏出更细粒度的 TLDRHQ 数据集,进一步点出我们所提出的数据集上不同的最先进的摘要模型。
Oct, 2021
本文介绍了以意见为主题的 ReCO 数据集,该数据集是目前中文阅读理解数据集中最大的,其中需要进行因果推理、逻辑推理等各种推理技能。与传统数据集不同的是,ReCO 除了提供上下文段落外,还提供支持证据,这为机器阅读理解提供了很好的挑战。
Jun, 2020
介绍了一种新的数据集推荐系统,该系统能够根据研究想法的简短自然语言描述,推荐相关的数据集。该系统通过使用机器学习技术创建了 “DataFinder 数据集”,并比较了各种信息检索算法在其测试集上的效果,同时还发布了数据集和模型以促进数据集推荐的进展。
May, 2023