utility function | BriefGPT

关键词utility function

搜索结果 - 29

子模参与式预算
参与性预算是通过收集和聚集个人偏好来分配公共资源的实践。本文探讨了子模的参与性预算问题，提出了三种偏好征集方法，并分析了它们在失真方面的表现。尤其要注意的是，如果效用函数是可加的，我们针对阈值批准投票设计的聚合规则优于现有的方法。
PDF17 days ago
无尽参数空间的功利算法配置
通用的功利算法配置是一种自动搜索给定算法的参数空间以优化其在给定输入集上通过给定效用函数度量的性能的技术。最近引入的功利配置过程提供了关于返回的参数化的最优性保证，同时可证明适应了底层问题的困难程度。然而，这些方法的适用范围受到严重限制，因
PDFa month ago
成本敏感的多层次贝叶斯优化及学习曲线外推的迁移
本文研究了基于成本敏感的多保真贝叶斯优化算法用于高效的超参数优化问题，引入了用户预定义的效用函数来描述成本和性能之间的权衡，并提出了一种新的获取函数和停止准则以动态选择每个步骤的最佳配置，并最大程度地提高未来效用，同时自动终止优化过程，通过
PDFa month ago
一种基于人工神经网络的经济一致的灵活效用规范的离散选择模型
本文提出了一种基于人工神经网络 (ANNs) 的新的离散选择模型 ——“特定备选和共享权重神经网络（ASS-NN）”，它在灵活拟合数据的效用函数的同时，与选择理论和货币可替代性（即 “一欧元就是一欧元”）两个假设保持一致，从而实现了经济一致
PDF3 months ago
基于价值的多目标强化学习在随机环境中的实证研究
本研究针对多目标强化学习中基于值函数的 Q-learning 算法在具有随机状态转移的环境中学习最优策略的问题进行了详细研究，考察了算法的变种以及奖励工程方法，并突出了噪声值估计问题对算法稳定性和收敛性的重要影响。
PDF6 months ago
风险敏感马尔可夫决策过程与普遍效用函数下的学习
在实践中，决策者经常面临着不同的风险偏好和不确定性的情况，传统的风险中性强化学习框架无法很好地捕捉到这些情况。本文提出了一种利用泛化的效用函数来解决风险敏感的强化学习问题的方法，并设计了可实现的近似算法来求解该问题。
PDF7 months ago
通过多任务双层优化学习主动学习的排序
活动学习是通过有选择性地请求标签以提高模型性能从而减少标注成本的一种有前途的范式。本研究提出了一种新的活动学习方法，通过一个学习的代理模型选择批次的未标记实例来进行数据获取，从而克服了现有活动学习方法所依赖于昂贵的获取函数计算、广泛的建模重
PDF8 months ago
模型与铁皮人 —— 使用大型语言模型进行 AI 对齐中的委托 - 委托代理问题的行为经济学研究
AI 对齐通常被认为是设计者和人工智能代理之间的互动，在这个互动中，设计者试图确保代理的行为与其目的保持一致，风险仅因设计者意图的效用函数与代理的内部效用函数之间的无意对齐冲突而产生。然而，我们认为，随着大型语言模型（LLMs）的出现，其中
PDFa year ago
关于 “最近邻算法有效的任务特定数据估值” 的注记
本文提出了新的软标签 KNN-SV 算法，该算法使用更自然、更可解释的效用函数，通过基于局部敏感哈希（LSH）的高效逼近算法，实现了对 KNN 分类器 / 回归器的数据 Shapley 的计算。实验证明，Soft-label KNN-SV
PDFa year ago
使用先验知识进行多目标参数优化的高效效用函数学习
本研究提出了一种基于偏好学习方法的离线学习效用函数的优化算法，不仅可以使用关于结果的偏好，还可以使用效用函数空间的粗略信息，尤其在使用很少的结果时有助于提高效用函数的估计精度，并且可以结合模型来考虑效用函数学习任务中发生的不确定性。
PDF2 years ago
谨慎学习多属性偏好
本文研究了一种小心的学习方法，用于预测在二进制属性之间选择的偏好和多属性偏好表达式建模的可靠性。我们采取了谨慎的态度，并使用支配关系（dominance relation）来进行预测，使用了多属性效用函数的参数不确定集来规定这种关系。
PDF2 years ago
多目标高效贝叶斯优化中的偏好探索
本文提出了一种基于贝叶斯优化和偏好探索的框架，通过实时采用基于成对比较的交互式学习和使用基于学习到的 DM 效用和结果的组合模型的贝叶斯优化来进行昂贵评估实验的优化。通过详细的模拟研究验证了偏好探索策略的表现。
PDF2 years ago
闭合算子：复杂性及其在分类和决策制定中的应用
本研究探讨了闭包算子的复杂性及其在机器学习和决策理论中的应用，提出了一个衡量闭包算子复杂性的概念，可用于衡量 ML 分类器或决策理论中的效用函数的复杂性。
PDF2 years ago
通过迭代改进效用函数实现 AGI 智能体安全
通过数学模型，我们提出了一种能够支持对 AGI 代理人的功能进行迭代改进的 AGI 安全层，该层可以在多种情况下部分或完全压制代理人的潜在危险，包括操纵其改进流程，并通过数学证明展示了本系统的工作原理。
PDF4 years ago
ACL基于答案的对抗训练生成澄清问题
本文介绍了一种生成澄清问题的方法，该方法通过建模假设答案作为潜在变量来引导生成更有用的澄清问题，并在两个数据集上评估了其性能。
PDF5 years ago
从原始选择数据中发现上下文效应
本研究旨在从原始选择数据中发现基于选择集的影响，并采用 CDM 模型对真实和模拟选择数据进行原则性探索分析。
PDF5 years ago
通过预测视图效用学习得分：高效的三维场景探索
该研究提出了一种基于卷积神经网络的学习型实用函数，用以预测和最大化探测未知场景中的有用信息，该方法在使用干扰噪声的情况下，比现有实用函数具有更高的重建性能，在城市场景的大型 3D 模型中得到了验证。
PDF6 years ago
贝叶斯神经网络中基于损失校准的近似推断
本文提出了一种基于 Bayesian 决策理论的新的、具有损失校准的证据下界来近似贝叶斯神经网络的真实后验分布，该下界依赖于一种效用函数，以确保我们的逼近方法对于具有非对称效用函数的应用程序具有更高的效用。此外，该方法具有与标准 dropo
PDF6 years ago
通识道德决策的计算模型
提出了一种基于社交动态的常识道德学习模型，描述了道德困境的效用函数，用于解决抽象的道德维度上的交易，并通过贝叶斯模型刻画了个体和团体的社会结构，从有限的观测数据中推断出个体和团体的道德价值，并将该方法应用于自主车辆道德困境数据。
PDF6 years ago
寻找最优 Bayesian 实验设计的自然选择启发式算法
我们提出了一种适用于一般优化问题的高效搜索启发式算法，特别针对 Bayesian 最优实验设计问题，并通过评估死亡，药物动力学和逻辑回归模型的最优 Bayesian 实验设计来展示其优越性，作为中等规模设计问题（即大约 40 个维度）的计算
PDF7 years ago