- 想象内分布状态:如何通过可预测的机器人行为实现用户对学习策略的控制
在这项研究中,我们正式阐明了一种问题,并提出了 Imaginary Out-of-Distribution Actions(IODA)这一初始算法,它使用户能够利用他们对机器人行为的期望来完成新任务。我们在一个真实机器人的用户研究中部署了 - 利用自然语言处理进行数学归纳证明的自动评分
数学证明教育的关键词包括准时反馈、自然语言处理、自动分级自由形式数学证明、用户研究。
- 在游戏开发中利用大型语言模型进行高效的故障分析
这篇论文提出了一种利用大型语言模型(LLMs)自动识别导致测试失败的代码更改的新方法,并通过定量和定性评估验证了该方法的有效性。通过 EA 开发者报告的问题进行的数据集评估结果显示,我们的方法在准确率上达到了 71%。此外,通过用户研究对我 - 贪婪 SLIM:基于 SLIM 的偏好调查方法
基于 SLIM 的贪心 SLIM 方法是用于偏好获取的一种新的训练技术,对于偏好获取比基于潜在因素模型的广泛使用的方法更加适用,通过离线实验和用户研究来评估其性能,结果表明该方法在用户研究方面表现出色。
- 大型语言模型是否比人类更具移情能力?
本研究通过与人类基准对比的方式,综合评估了四个最先进的大型语言模型(GPT-4、LLaMA-2、Mixtral-8x7B 和 Gemini-Pro)在共 2000 个情感对话提示中的回应中的移情能力。我们的发现显示,大型语言模型在移情回应能 - DrHouse: 一个通过利用传感器数据和专家知识强化的诊断推理系统
利用大型语言模型、智能设备和医学数据库,开发了一种名为 DrHouse 的多轮问诊虚拟医生系统,通过结合传感器数据、实时更新的医学数据库和新型诊断算法,显著提高了诊断准确性和可靠性,且通过用户研究证明了其广泛应用前景。
- 使用分层扩散笔简化图像编辑
基于层次扩散刷子的实时图像编辑技术结合了图像编辑概念,通过精细的区域导向修改中间去噪步骤,保持输入图像的完整性和上下文,并在高端消费级 GPU 上在 140 毫秒内呈现 512x512 图像的单个编辑,从而实现实时反馈和候选编辑的快速探索。 - 虚拟现实中全景图像高品质导航和缩放学习
OmniVR 是一个设计用于提升虚拟现实导航过程中视觉清晰度的新系统,通过学习算法和使用者输入优化全景图像,有效解决模糊效果对用户体验的影响,提高用户的参与度和沉浸感。
- 学习用非语言表达传达功能状态,以提高人机协作
通过调节非语言音频表达的声学参数值,基于强化学习算法和人类反馈,研究评估了协作机器人内部状态的非语言音频表达对用户是否准确理解机器人状态的影响。
- ACL使用自适应共情回应教授英语
该研究提出通过音频识别负面情感以实现具有自适应共情反馈的英语教学聊天机器人,并通过初步用户研究证明了该系统的有效性。
- 通过点击学习图像抠像的 Trimap
通过分析真实用户的行为逻辑和三角形模板的特性,我们成功提出了一个强大的迭代三类训练策略和一个专门的模拟功能,使 Click2Trimap 在各种场景下都表现出多样性。定量和定性评估合成和实际世界的抠图数据集表明,与所有现有的无三角形抠图方法 - 个性化解释基于人工智能推荐的用户认知能力的实证评估
通过对智能辅导系统生成解释进行个性化处理,针对具有认知需求和勤奋度水平较低的学生,旨在增加这些学生对解释的参与度以促进学习,在用户研究中发现,该个性化处理显著增加目标用户与提示解释的互动、理解程度和学习效果,因此,该研究为个性化 AI 解释 - 表情译文:为任意文本丰富表情符号
通过大型语言模型的帮助,Emojinize 方法能够将任意文本短语翻译为一个或多个表情符号序列,以增强其表达能力。经过用户研究,我们发现 Emojinize 的表情符号翻译能够提升掩盖词的猜测性,表情符号的选取比人工选择的表情符号翻译提高了 - PaperWeaver:将用户收集的论文与推荐论文的上下文相结合,丰富主题论文提醒
研究人员订阅 “论文提醒” 系统以获取最近发布的与其之前收集的论文相似的推荐论文,但由于现有系统仅提供论文标题和摘要,研究人员有时难以理解这些推荐论文与其自身研究背景之间微妙的联系。为了帮助研究人员发现这些联系,我们提出了基于用户收集的论文 - 墨迹效果:ChatGPT 作为合作创作游戏设计师的案例研究
这篇论文研究了大型语言模型如何作为高效的、高水平的创作合作者和游戏设计的 “灵感”,并通过艺术家使用模糊的墨斑作为创造灵感的练习为研究设计建模。我们旨在确定与人类设计师实施的创造意图相比辅助人工智能是否能够改善、阻碍或提供另一种质量的游戏。 - 透明图像层扩散的潜在透明度
我们提出了 LayerDiffusion 方法,使得大规模预训练潜在扩散模型能够生成透明图像。该方法通过将 alpha 通道透明度编码到预训练潜在扩散模型的潜在流形中,学习了 “潜在透明度”。通过调整潜在空间并微调预训练模型,可以将任何潜在 - 知识密集环境中的聊天机器人:意图和基于 LLM 的系统的比较
认知助手通过自然语言处理和大型语言模型的应用,在知识密集型任务中表现出更好的用户体验、工作负担、可用性和性能,建议进一步研究切换自然语言处理技术的潜力。
- 大型语言模型对人类创造性思维的均质化效果
使用大型语言模型(LLM)作为创意支持工具(CST)可能会使用户感到更有创造力,增加每个用户建议的观点范围,但也可能使不同用户的建议观点趋同。通过进行一项 36 位参与者的用户比较研究,我们发现与同一类别的 CST 相比,使用 ChatGP - BootPIG: 在预训练扩散模型中引入零样本个性化图像生成能力的引导
通过提出的 BootPIG 架构,使用引导图像来指导生成图像的外观,增强了现有的文本到图像生成模型的个性化能力,并通过用户研究证实了 BootPIG 在保持引用对象外观和与文本提示对齐方面的优越性。
- 大规模支持大型语言模型输出的意义构建
研究了如何同时呈现多个大型语言模型的响应,设计了包括计算文本文档之间相似性和差异性的预存和新方法以及如何渲染它们的输出的五个特征,通过对用户研究和八个案例研究的评估发现这些特征支持多样的意义理解任务,并使之前被认为过于困难的任务现在变得可行