- 人性化自动机器学习范式的行动呼吁
自动化机器学习(AutoML)的全面潜力在于解决目前未充分探索的用户与 AutoML 系统的交互方面,包括其不同角色、期望和专业知识,促进未来 AutoML 研究中更加以人为中心的方法,推动紧密整合人类专业知识和自动化机器学习方法的 ML - VR-GPT:智能虚拟现实应用的视觉语言模型
本研究介绍了一种创新方法,利用 VR 环境中的 VLMs(Visual Language Models)来增强用户交互和任务效率,通过自然语言处理实现实时、直观的用户交互,不依赖于视觉文本指令。使用语音识别和文本转语音技术,使用户与 VLM - 交互作用:一种基于用户交互的图像分类模型解释方法
通过用户互动,我们提出了一种基于互动的可解释的 AI 方法,通过修改图像来观察分类结果的变化,使用户能够辨别影响模型决策过程的关键特征,从而将他们的心智模型与模型逻辑对齐。该方法通过用户参与和理解为可解释的 AI 系统提供了更直观和易于访问 - 激励电子画笔:用户作为创作者的生成型人工智能
该论文呼吁建立适应技术发展并保障公共利益的监管框架,通过研究文本到图像生成器和纠正有关生成智能和用户交互的误解,挑战知识产权办公室不承认生成智能用户为版权保护资格的观点,并主张将这些工具融入到创作活动中的生成智能用户得到认可的简化和简化注册 - FlowMind: 使用 LLMs 自动生成工作流
Robotic Process Automation (RPA) 的快速发展在自动化重复任务方面取得了显著进展,然而在用户要求进行即兴或不可预测任务的场景下,其效果减弱。本文介绍了一种新的方法 FlowMind,利用大型语言模型(LLMs) - 通过机器学习语言模型增强操作系统中的用户交互
使用大型语言模型进行用户交互的研究,结合机器学习和交互设计来改善推荐系统和操作系统的用户体验,以提供更智能和个性化的服务,满足用户需求并促进产品的不断改进和优化。
- 控制色彩:多模态扩散交互式图像着色
引入了一种多模态的着色方法,通过利用预训练的稳定扩散模型,支持高度可控的交互式图像着色,解决了多种限制性问题,包括用户互动、局部着色、非自然色彩渲染、色彩变化不足和色彩溢出。
- MetaAID 2.5:基于大型语言模型的开发元宇宙应用的安全框架
通过模拟用户与大型语言模型的交互,提出了一种增强网络安全的方法,包括全面的元宇宙网络安全问答和攻击模拟场景,以帮助用户认识和抵御风险,并通过扩展训练来理解个性化输入和表情符号等用户内容,验证了该方法的有效性。
- 理解代理程序:利用大型语言模型进行行为解释
基于状态和行为观察生成自然语言解释,不依赖于基础模型的表示,能解释智能代理行为,使用户能够与预训练的大型语言模型进行交互并生成有助于解释与推理的解释。
- 用大型语言模型解释代理行为
智能代理通过观察状态和行为生成自然语言解释,以理解其行为,从而促进与用户的互动。
- 评估潮起潮落:跨多个平台深度分析问答趋势
本研究通过分析六个广受欢迎的 CQA 平台中的元数据、问题的表述以及用户之间的互动水平与首次回答问题所需的时间之间的相关性,并运用传统机器学习模型预测哪些问题将会迅速获得首次回复。
- 高斯混合分布潜在空间中的反事实解释搜索
通过改进自动编码器的潜空间生成方法,该论文介绍了一种新的生成反事实解释的方法,该方法在保持输入样本特征的同时能有效地返回更接近原始数据的结果,适用于高维机器学习应用。
- 针对英文手写体草书和印刷体的端到端交互式深度学习标注系统
本文介绍了一种创新的、完整的端到端流程,采用深度学习和用户交互技术,对印刷和草书英文手写手稿进行注释,该方法使用了最先进的文本识别模型构建的检测系统和自定义的深度学习模型,结合易于使用的交互式界面,旨在提高检测、分割、序列化和识别阶段的准确 - CVPRLightPainter: 自由手绘实现的交互式人像重照
介绍了 LightPainter,一种基于草图的重新照明系统,使用两个条件神经网络和一种新型草图模拟过程进行建模,可实现用户交互式改变头像照明效果,且操作简便,实验结果表明该系统具有优秀的针对人像照明的灵活性和高质量,用户更偏好该系统相对于 - 基于社交意识强化学习的主动型对话代理改进
通过采用强化学习算法,研究设计基于社交和任务相关特征的行为预测策略是智能对话代理下一步的发展,以期通过优化设定的预测性对话策略,增强用户满意度和任务效率,并在实践操作中取得较好的协同效果。
- 面向流程相关用户交互日志的参考数据模型
本研究提出了一种普适的过程相关用户界面 (UI) 日志参考数据模型,以解决 UI 日志缺乏标准化的问题,该模型可用于任务挖掘或机器人流程自动化 (RPA) 等用途,并扩展到 XES 日志交换标准。
- ECCVPseudoClick: 带有点击模拟的交互式图像分割
本文提出一个名为 PseudoClick 的框架,使得现有的分割网络能够提出候选的下一步点击,从而进一步减少用户交互成本,该框架的目标是通过最少的用户点击来获得精确的对象分割掩码。
- SIGIR基于 BERT 模型的会话感知序列推荐中的会话信息利用
本研究提出三种利用用户交互记录中的会话信息来改进推荐系统性能的方法,并应用于基于 BERT 的顺序推荐模型,既可以在保证模型整体简洁性的同时,提升推荐结果。
- ACL大规模对话 AI 系统中可扩展和鲁棒的自学习技能路由
本文提出了一种可扩展的自学习方法,以探索技能路由替代方案,无需引起用户体验中断的突然更改,并通过经常的模型更新逐步改善路由,通过离线和在线 A / B 实验在商业大规模对话系统中演示了所提出方法的实际效果。
- ACL通过观察人类跟随行为实现基于场景指导生成的连续学习
研究自然语言指令生成的连续学习,在观察人类用户执行指令的基础上,并比较用户执行结果和系统原始意图的差异,以此作为信号改善系统的指令生成能力。通过与真实用户的交互,系统在语言生成能力方面表现出巨大的进步。