- 在线巴累托最优决策中的主动推理
本研究旨在引入一种新颖的多目标强化学习框架,确保任务的安全执行,优化目标之间的权衡,并符合用户的偏好。该框架包含两个主要层次:多目标任务规划器和高层选择器。通过案例研究和基准测试,证明了我们的框架在操作和移动机器人方面优于其他方法,并且能够 - 建筑环境中辅助移动机器人的社交感知共享控制导航
本研究介绍了一种新的基于共享自治导航系统的社会感知的辅助机器人平台,该平台以听取用户喜好为导向,实现了较安全、较自主的导航,以提高辅助移动技术在建筑环境中的可接受度。
- SIGIRReCODE:用神经 ODE 模型重复消费行为
利用神经 ODE 模型再现用户在实际推荐系统中的重复消费行为,以捕捉时间间隔的动态模式,并结合静态偏好预测模块,对用户在特定情境下的个性化偏好进行综合建模。实验证明,该模型明显提高基准模型的性能,并优于其他对比方法。
- 基于提示的半结构化自然语言状态追踪的检索增强型对话推荐
对话式推荐系统必须理解用户偏好和意图的丰富多样的自然语言表达,而这些表达通常以间接方式传达(例如:“我在控制体重”)。这些复杂的话语使得检索相关物品变得具有挑战性,尤其是当只使用通常不完整或过时的元数据时。幸运的是,许多领域都有丰富的商品评 - 基于 CLIP 的交互式图像检索中的相关性反馈再审
通过集成 CLIP 与经典的相关反馈技术以增强图像检索,我们提出了一种交互式基于 CLIP 的图像检索系统,并利用相关反馈收集用户独特的偏好,从而适应不同用户的偏好并实现高准确性的图像检索。
- 将消歧和用户偏好融入大型语言模型中的机器人运动规划
该研究论文介绍了一个框架,可以解释人类包含时间元素的导航指令,并直接将其自然语言指令转化为机器人的运动规划。
- 人工智能与用户相互塑造的会计学:数学模型的作用
当 AI 系统进入越来越多的社会领域时,它们日益塑造并受到用户的偏好、观点和行为的影响。然而,AI 系统的设计很少考虑到 AI 和用户如何相互塑造。本论文提出了发展数学上明确规定 AI 和用户相互塑造的形式交互模型的理念,该模型可以用于制定 - 个性化多模态生成与大型语言模型
该论文提出了一种使用大型语言模型进行个性化多模态生成的方法,并通过实验验证了其性能,在推荐系统等应用中具有重要意义。
- 个性化负反馈贮存器在推荐系统中的增量学习
为了改善用户体验,推荐系统需要不断扩展和提升模型,但这会带来更多的计算负担。本文提出了个性化的负样本储备策略,平衡了遗忘与可塑性,有效地处理增量学习问题。通过在三个常用的增量推荐模型中整合我们的设计,我们实现了在标准基准测试中的最新成果。
- 多目标可微分神经架构搜索
我们提出了一种新的神经架构搜索算法,通过超网络对设备和多个目标进行参数化和条件化,实现了性能和硬件度量之间的权衡,并在一次搜索中获得多设备上的具有代表性和多样性的架构。在高达 19 个硬件设备和 3 个目标的大量实验证明了方法的有效性和可扩 - Markovletics: 学习连续时间马尔可夫链混合模型的方法及一种新应用
该研究介绍了一种新颖的连续时间马尔可夫链混合模型,重点研究了观察路径长度和混合参数对问题范畴的影响,并通过实验证明了离散化连续时间路径对混合模型的可学习性有重要影响,为不同问题情境下的算法选择提供了关键见解。
- InteraRec: 使用多模态大型语言模型的交互式推荐
通过捕获用户在网站上导航过程中的高频截图,利用多模态大型语言模型(MLLM)从这些截图中提取用户偏好的有价值洞察,基于预定义的关键词生成用户行为摘要,并将该摘要作为输入传递给 LLM 综合优化设置,从而产生量身定制的推荐,我们的实验证明了 - LLM 对全球表征的非预期影响
通过对大型语言模型进行对齐,开发人员可以根据用户的偏好通过多种程序(如强化学习自人类反馈和直接偏好优化)将其用于面向用户的应用程序。然而,当前的评估过程侧重于指令遵循、推理和真实性等基准,而人类偏好并非普遍存在,对特定偏好进行对齐可能会产生 - 相对偏好优化:通过对相同和不同提示的对比响应来增强 LLM 对齐
通过对比加权机制,Relative Preference Optimization (RPO) 提出了一种针对大型语言模型的优化方法,提高了模型对用户偏好的理解能力,并在训练过程中提高了适应性。
- 个性化人类反馈的个性化语言建模
发展个性化语言模型的方法,结合用户模型和语言(或奖励)模型的学习目标,对个性化语言模型进行强化学习,以更好地满足用户偏好。
- 任务成功并不足够:调查使用视频 - 语言模型作为行为批评家以捕捉不良代理行为
在具体 AI 领域,利用大规模生成模型结合外部验证者,根据验证反馈逐步迭代推导最终解决方案,以验证是否达到说明中的目标条件,以便无缝整合到日常生活中,超越任务成功,和大范围的约束和个人偏好,为此构建一套测试基准,通过全面评估视觉与语言模型在 - 通过聚类进行偏好学习的分层在线专家框架
利用低维潜在空间加速用户偏好学习的层次聚类框架可提供高效的出行推荐算法,特别适用于具有层次结构的环境中降低遗憾度。
- 构建推荐系统中的大规模基数处理
该论文提出了两种创新技术来解决推荐系统中高基数的挑战,通过采用词袋模型和层共享相结合的方法,显著减少模型大小并提高性能,在优步的使用案例中进行了离线和在线实验,取得了有希望的结果,展示了优化推荐系统及提高其整体性能的有效方法。
- LLMRS:发挥基于 LLM 的推荐系统在软件购买中的潜力
通过使用预训练的大型语言模型对用户评论进行编码并生成个性化推荐,我们提出了 LLMRS,一种基于 LLM 的零样本推荐系统。在真实世界的 Amazon 产品评论数据集上进行实验,结果表明 LLMRS 优于基于排名的基线模型,成功从产品评论中 - Ada-Retrieval: 自适应多轮检索范式用于顺序推荐
本文提出 Ada-Retrieval,一种适应性多轮检索范式,用于推荐系统,通过迭代地改进用户表示以更好地捕捉完整物品空间中的潜在候选物,实验结果表明 Ada-Retrieval 显著提升了各种基础模型的性能。