human-in-the-loop | BriefGPT

关键词human-in-the-loop

搜索结果 - 65

人类参与下的新颖性生成
介绍了一种使用抽象环境模型的新颖性生成方法，不需要特定领域的人为指导即可生成更多的新颖性，然后采用人类的辅助选择和过滤这些生成的新颖性，并在 Monopoly 和 VizDoom 领域中测试了该方法的结果。
PDFa year ago
ACLActiveAED: 人在循环中改善注释错误检测
本文提出了 ActiveAED 的 AED 方法，可在预测循环中反复查询人类进行错误修正，从而更准确地检测错误，并在八个数据集中获得了提高的结果。
PDFa year ago
通过主动奖励学习实现证明反馈高效强化学习
本文提供一种以人类在强化学习中的角色为基础的算法框架，旨在从理论角度解决设计有效的奖励函数的问题。我们提供了一种主动学习的 RL 算法，通过仅在某些状态动作对上询问少量关于任务奖励的问题，保证以高概率提供几乎最优的任务策略。
PDFa year ago
从解释到行动：用于异常推理和管理的端到端人在循环框架
本文提出 ALARM 框架，支持从检测到操作的全面异常挖掘，包括无监督的新兴异常检测、异常解释和交互式 GUI，以帮助人类完成闭环过程，通过设计新的检测规则来实现探索、理解和最终采取行动并演示了该方法的有效性。
PDFa year ago
ACL一种以用户为中心，交互式，人机交互主题建模系统
开发了一种新型交互式人机协同的主题建模系统，支持对语料库特定方面的主题建模，具有易于使用的界面、记录与比较功能以及主题词推荐功能，经过多次用户研究验证，该系统在主题建模中的应用具有显著价值。
PDFa year ago
基于不确定性感知的强化学习，用于人在循环机器人代理的决策制定
本文介绍一种基于强化学习的半自主智能体，当其对任务成功的信心较低时，通过估计当前状态回报的方差来请求外部帮助，该方法在离线训练期间没有访问专家，并在多个离散导航问题中有效利用有限的专家调用预算。
PDFa year ago
adaPARL：面向序列决策人机交互系统的自适应隐私感知强化学习
adaPARL 是一种基于个性化隐私 - 效用权衡的自适应隐私感知强化学习方法，为物联网中的人机交互系统提供了一种用于应对隐私泄露的解决方案。在两种人机交互应用程序中，adaPARL 提供了一种个性化的隐私 - 效用权衡，并证明了其具有很好
PDFa year ago
ACL人机交互的模式识别
使用 GPT-3 驅動的人機交互式 Schema induction 系統，能夠更輕鬆地在新領域中識別模式，並減少人工監管的負擔，從而生成更好的圖形表示。
PDFa year ago
AutoDOViz：人本决策优化自动化
本文介绍一种基于自动决策优化和强化学习的用户交互界面 AutoDOViz，旨在降低数据科学家在问题规范上的门槛，利用 AutoDO 算法搜索 RL 管道并创建可视化和方针洞悉，为 DO 专家和领域专家之间的沟通提供便利。经过 DO 实践者和
PDFa year ago
针对文本文档的高精度信息提取的人机协作优化
本文研究信息提取方法，提出利用人工验证的弱监督标记方法，结合人工与计算机快速处理，以实现在精度要求高的情境下避免纯手工提取耗时过长的难题，并在犯罪司法数据集上实证其优越性。
PDFa year ago
EMNLPDoSA：人机协同加速商务文件标注系统
介绍了利用文档通用数据集和模型进行启动的 DoSA（文档特定自动注释）方法。通过自动化的方法生成的初步注释可以由人类审查其正确性。这些注释可以用作训练新的文档特定模型的反馈，其中自动化注释可以经过人工审查以检查其正确性。本文的范围仅限于类似
PDF2 years ago
AAAI用于野外机器人自适应实验设计的决策支持系统分类
基于决策支持系统（DSS）在其他领域中的成功案例，本文为自适应实验设计提出了通用术语和一个六阶段的 DSS 分类标准。通过人 - 机交互，旨在最大化信息获取，同时尽量减少实验成本，我们提出了使用 DSS 增强人类决策能力的方法，以协助决策制
PDF2 years ago
利用强化学习代理为人在环境中提供遵守建议的验证
本文介绍了一种基于 Tree-based lingua-franca 的新颖交流方法，并探索了基于此方法的 Human-in-the-loop 反馈机制，提供具有可解释性的方法以解决 Advice-Conformance Verificat
PDF2 years ago
医疗对话中功能性段落的学习：迭代拟标记和人在循环方法
本文提出一种基于伪标签和人机协同方法的医疗对话自动分类算法，通过联合使用 bootstrap 和人机协同方法，最终在一个专家标注的数据集上将分类准确率从 69.5% 提高到 82.5%。
PDF2 years ago
反馈类型对解释性互动学习的影响
本研究使用了 Explanatory Interactive Learning 方法中的 Gradient-weighted Class Activation Mapping 模型，比较了两种用户反馈类型对图像分类任务的影响，结果表明，指出
PDF2 years ago
寻找不可证伪声明中的结构
本文介绍了一种人机交互的方法 PAPYER，用于从社交媒体平台上的评论中提取关于卫生的核心故事，并通过结合机器和人的核心方法，发现了一些预备故事线，优于最近的大型变压器模型和最先进的无监督主题模型。
PDF2 years ago
面向困难度调整的课程强化学习中的人类决策
研究人员设计了一个交互平台，利用人类的决策过程，通过向导课程强化学习结果，实现了成功地调整强化学习性能以适应人类期望困难程度的目标，并证明人类与计算机互动式课程增强学习的有效性，促进了该领域的发展。
PDF2 years ago
IJCAI人类不是玻尔兹曼分布：应对强化学习中人类反馈与交互建模的挑战与机遇
该论文呼吁从不同学科出发进行研究，以解决人类如何向人工智能提供反馈以及如何构建更健壮的基于人类协作的强化学习系统的关键问题，并提出人类模型必须是个性化，情境化和动态的观点。
PDF2 years ago
平衡成本和质量：探索人在环中的框架，用于自动化短答案评分
本文介绍了一种人与深度学习模型相结合的方法，用于保证短文评分的质量和降低评分成本。通过引入可靠度估计方法来强制高质量的自动评分结果，同时把低可靠度的评分结果交给人类评分者来完成，实现了自动评分和人类评分者的协同作业。实验表明，该方法可以达到
PDF2 years ago
在交互式人机协同 AI 公平性中促进最终用户的参与
我们探索了一种人机交互界面的设计，使得普通用户可以识别潜在的公平问题并在贷款决策的背景下解决它们，为评判和解决人工智能的公平性做出贡献。
PDF2 years ago