learner | BriefGPT - AI 论文速递

关键词learner

搜索结果 - 17

带挑战反馈的主动聚类
在本文中，我们研究了主动聚类问题（ACP）。一个学习者与具有 d 维亚高斯反馈的 N 臂随机赌博机交互。存在一致维向量的 K 个组将臂分为隐藏分区，同一组中的臂共享相同的均值向量。学习者的任务是以最小的预算发现这个隐藏分区，并且误差概率小于
PDF19 days ago
具有自适应上下文的因果情境助推
我们研究了一种因果背景下的情境式赌博问题，学习者基于由其选择的初始干预进行上下文选择。在每一轮开始时，学习者根据其选择的初始行动选择一个随机上下文并获得奖励。通过引入一个与实例相关的因果参数 λ 来实现上界，并且通过使用凸优化来解决赌博探索
PDFa month ago
在线分类与预测
在线分类研究中，研究者利用对未来示例的预测来改进在线学习算法，以减小期望遗憾并提高分类准确性。该研究还证明了当未来示例可准确预测时，在线学习可以与转导式在线学习相媲美，从而对近期基于预测和分布假设的在线算法的研究提供了补充。
PDFa month ago
在线策略分类中的错误、操控和保证金
在一个在线的战略分类问题中，每个到达的代理可以操纵其真实特征向量以获得正面的预测标签，同时付出依赖于操纵量的成本。学习者在仅能访问操纵后的特征的情况下，试图预测代理的真实标签。之后学习者公布其预测，代理的真实标签被揭示。我们提供两种新算法，
PDF3 months ago
贝叶斯战略分类
在战略分类中，学习者以一定的代价修改特征，以期从学习者的分类器中获得正面分类。我们考虑学习者在战略分类中部分信息披露的问题，研究代理在非完全了解分类器参数的情况下的最佳响应。我们展示了部分信息披露在增加代理操纵能力的同时，反直觉地有利于学习
PDF5 months ago
使用自然语言和概率推理进行实验和修订规则
我们构建了一个计算模型，用于描述人类如何通过实验主动推断隐藏的规则。该模型的基本原则是，即使规则是确定性的，学习者也会考虑到更广泛的模糊概率规则，通过自然语言表示，并根据近似贝叶斯原则在每次实验后在线更新其假设。在同一框架中，我们还根据信息
PDF5 months ago
历史平均相关成本的在线决策
在许多在线顺序决策场景中，学习者的选择不仅影响当前的成本，还影响未来的成本。本文研究了一种特殊情况，其中成本依赖于过去决策的时间平均值，我们提出了一种新颖的算法 Follow-The-Adaptively-Regularized-Leade
PDF7 months ago
基于 MAP 和 MLE 的教学
通过构建一个被先验参数化的 MAP 学习器，该文研究了不同采样模式下潜在概念的教育维度，进而证明了一些单调性质以及展示了其与 VC 维数等组合参数的关系。
PDFa year ago
弃权排名
我们介绍了一种新的排名框架，其中学习器可以以有限的代价 $c$ 放弃对某些预测的判断，并对这个框架进行了广泛的理论分析，包括一系列 $f$- 一致性边界，达到了此领域的最新理论保证水平，我们进一步提出，这种新的放弃策略在使用常见的等连续假设
PDFa year ago
KDD基于表达式相似性的数学问题检索器 MWPRanker
本文提出了一种用于检索类似数学单词问题（MWP）的混合方法，该方法参考将同样的操作序列用于解题，通过与语义相似性方法相比，展示了更好的效果。
PDFa year ago
基于多任务表现的专家活跃排名
针对评估专家在多项任务上表现的问题，提出了一种策略，使得能够通过接收含噪声的反馈信息，实现对专家排名的正确恢复，并且该策略适应问题的复杂程度，并提供了与理论结果一致的数值模拟。
PDFa year ago
语义交互学习用于文本分类：一种基于上下文交互的构建方法
本文提出了一个基于语义学习的交互框架，将人类提供的构建性和上下文反馈融入到机器的学习过程中，提出了一种称为 SemanticPush 的技术，该技术能够有效地为机器推理向期望的行为进行人类概念修正的转化。我们在多分类任务中展示了基于语义学习
PDF2 years ago
开放问题：上下文赌博机的模型选择
这篇论文探讨了在上下文赌博学习中，是否可能采用模型选择算法，以适应最佳假设类的复杂性，并寻求类似于统计学习中的算法保证。
PDF4 years ago
ACL通过阅读时的眼动来评估语言能力
我们提出了一种新颖的方法，利用学习者阅读时的眼动痕迹来确定学习者的第二语言能力水平，并通过其反映出学习者阅读中的凝视模式与母语为英语者的相似程度，这种方法对于第二语言能力评估具有潜在的价值。
PDF6 years ago
独立可控因素
通过允许学习者与其环境交互，我们提出了一种特定的目标函数来发现相应于环境中互相独立可控方面的因素，并在没有任何外在奖励信号的情况下验证其可以实际分离出这些因素。
PDF7 years ago
ACL正向批判：创造更好的视觉问答数据集所学到的经验教训
本研究通过分析现有数据集中模型和人类的实验结果，研究了视觉问答的数据集设计问题，提出了自动解决设计缺陷的方法，并对两个流行的视觉问答数据集进行了修补，同时创建了一个视觉基因组项目的新视觉问答数据集，这是当前任务的最大数据集之一，经测试其改进
PDF7 years ago
独立可控特征
本文旨在研究如何在交互环境中通过找出学习者可控制的因素来寻找控制观察数据变异因素的因素，提出了一种新颖的方法并在实验中进行了测试。
PDF7 years ago