- ACL文本到图像生成中的图像引导的提示优化
将用户提供的自然语言提示自动精炼为系统偏好的关键词提示,对于文本到图像生成的用户体验至关重要。本研究提出了 Prompt Refinement with Image Pivot (PRIP) 方法,通过使用用户偏好图像的潜在表示作为用户和系 - 基于 Koopman 轨迹模型的 ISAC 启用的物联网系统中的高移动性范式和计算卸载
移动设备上的用户体验受到有限的电池容量和处理能力的限制,但 6G 技术的进步正在迅速促使移动技术的演进。移动边缘计算(MEC)提供了一种解决方案,将计算密集型任务卸载到边缘云服务器,与本地处理相比减少了电池消耗。即将到来的移动通信的集成感知 - Airbnb 地图排序学习
对于 Airbnb 的用户体验,本研究通过重新设计地图上的列表排名算法,使其适应不同于以列表形式呈现的搜索结果的地图界面,从而获得了极大的改进。
- 生成人工智能引导的用户研究:应用于空中出租车服务
利用大型语言模型(LLM)创建产生式人工智能虚拟场景,通过招募真实用户评估体验,收集反馈以便在早期设计阶段进行快速迭代,本研究以空中出租车为案例研究,使用 OpenAI 的 GPT-4 模型和人工智能图像、视频生成器设计了虚拟空中出租车,经 - MIND:从大型视觉 - 语言模型中蒸馏多模态购物意图以实现电子商务购买理解
利用 MIND 多模态框架,从多模态产品元数据中推断购买意向,优化用户体验和提供个性化搜索结果,进而提高大型语言模型的意向理解任务效果。
- 云计算中可延迟工作负载的在线调度的先进强化学习框架
云计算平台中的高效资源利用与完美用户体验通常相互冲突。本文提出了一种名为 “云中可延迟作业在线调度” 的在线可延迟工作调度方法,采用深度强化学习模型学习调度策略,并利用多个辅助任务提供更好的状态表示和改进模型性能,从而在在线环境中合理安排部 - ChatGPT 基于对话推荐系统的用户体验导航:提示引导和推荐领域的影响
使用 ChatGPT 为基础的对话式推荐系统研究了 Prompt Guidance(PG)和 Recommendation Domain(RD)这两个因素对系统整体用户体验的影响,并发现 PG 可以大大提升系统的可解释性、适应性、感知易用性 - 推荐系统中的意图多样化
推荐系统中往往过于关注短期参与度,而此项研究关注将用户意图整合到整页推荐中以优化用户的长期体验。
- 通过脑机接口建模用户偏好
使用脑机接口(BCI)技术研究用户的注意力、认知和情感状态,推导用户偏好以及与视觉内容的关联,并将其应用于信息检索、生成模型的个性化控制以及群体情感估计。
- 提升机器人口音适应能力:消除含糊不清的说话
在不同环境和语境下,研究了人与机器人之间的口语交流并提出了自适应语音的模型,研究表明,良好的声学质量与可理解性和用户体验正相关,而距离远、分散背景声音会降低可理解性和用户满意度。经过评估表明,自适应声音参数相比固定声音参数具有更好的可理解性 - 软件测试自动化中基于环境感知的人工智能视觉变化检测
这项研究介绍了一种基于图形的方法,用于软件测试自动化中的可视变化检测,通过机器学习模型准确识别软件截屏中的用户界面控件,并构建表示控件之间上下文和空间关系的图形,利用该模型可以检测和突出显示用户界面的视觉回归,该方法在各种简单和复杂测试场景 - 天书副驾驶员:面向自主电子病历导航
通过自动化例行任务和简化电子病历系统的文档流程,我们的研究结果突显了自主代理对于减轻临床医生当前电子病历系统带来的认知负荷所具有的重要潜力。
- 基于面部情绪识别的音乐推荐
通过集成情感识别、音乐推荐和可解释人工智能,利用 GRAD-CAM 的方法可以提高用户体验。在情感分类上,该系统的准确率达到 82%,并利用 GRAD-CAM 提供预测的解释,使用户能够理解系统推荐背后的原因。该论文提出的方法利用 ResN - 基于系统和用户角度的对话推荐系统评估协议
当前的对话推荐系统 (CRS) 在现实场景中的用户体验遭受批评,尽管在学术界取得了显著进展。存在着针对 CRS 的评估协议可能偏重系统中心因素,如对话的效果和流畅性,而忽视了用户中心的方面。因此,我们提出了一个新的全面的评估协议 Conce - Talaria: 交互式优化机器学习模型以实现高效推理
Talaria 是一个模型可视化和优化系统,通过在设备上进行机器学习来保护用户隐私并提供智能的用户体验。通过优化模型、平衡硬件指标,如模型大小、延迟和功耗,Talaria 帮助从业者创建高效的机器学习模型。
- 通过可控的大型语言模型实现安全性和帮助性平衡的响应
我们提出通过在大型语言模型中控制安全性和有益性来平衡多种用例,采用训练无关和微调方法来分析在语言模型中控制安全性和有益性的挑战,并通过实验验证了我们的方法可以控制模型并提供帮助。
- 文化敏感性与语音助理的未来联想
通过在线共拟研究,探索了在非西方背景下(如日本)共设计语音助手的价值,并强调文化差异对话语、社交互动和对技术的态度的敏感性。提供了针对日本和英语为主的美国背景的设计指南,以及行为辅助技术设计和学术研究中多元文化的机遇。
- DeepSeek-VL: 实现真实世界的视觉 - 语言理解
DeepSeek-VL 是一个开源的视觉 - 语言模型,设计用于实际的视觉和语言理解应用,通过多样性数据、基于用户场景的细分以及高效的编码方式来提升模型的用户体验和性能。
- 提升社交机器人对受控与自然人机交互的视觉感知
社交机器人使用视觉感知来理解用户和环境,本研究使用深度学习模型改进了社交机器人的视觉感知功能,并通过实验评估了该功能对用户交互性能和体验的影响。
- 基于 Transformer 模型的智能电子商务推荐的文本理解与生成
Transformer 结构预训练模型在电子商务领域的核心应用场景包括但不限于产品描述的自动生成、用户评论的情感分析、个性化推荐系统的构建和客服对话的自动处理。本研究通过对模型的工作原理、实施过程和具体案例中的应用效果进行详细分析,强调了预