scoring rules | BriefGPT - AI 论文速递

关键词scoring rules

搜索结果 - 21

ElicitationGPT：基于语言模型的文本引导机制
使用领域知识自由的查询机制，该论文利用大型语言模型（具体来说是 ChatGPT）对采集到的文本与真实文本进行评分，并通过实证评估其与人类偏好的一致性。该实证评估基于同行评阅数据集中的同行评阅，并与手动评分进行比较。
PDF23 days ago
ICML严格适当评分规则的语言生成
基于最大似然估计（MLE）的语言生成是文本生成的基本方法之一。本文提出了一种简单的策略，用于适应语言生成中的评分规则，并使用两种经典的严格适当评分规则 ——Brier 得分和 Spherical 得分进行训练，从而显著提高了模型的生成能力。
PDFa month ago
适当校准误差的一致且渐近无偏估计
提出了一种方法，可以一致且渐近无偏地估计所有适当的校准误差和改进术语，并验证了所提估计器的所述特性，并建议后续校准方法的选择应由所关注的特定校准误差决定。
PDF7 months ago
基于评分规则最小化的概率自监督学习
本文提出了一种通过 Scoring Rule Minimization 进行的新型概率自监督学习方法（ProSMIN），利用概率模型增强表示质量和减少崩溃表示，我们的方法通过两个神经网络（在线网络和目标网络）协作学习彼此的多样表示分布，通过
PDF10 months ago
透过正确评分规则激励真实有效的预测
本论文探讨了当预测可以影响结果时，如何激励专家准确报告其信念，发现最大化预期得分的报告通常不反映专家的信念，给出了其不准确性的界限，并讨论了其他激励机制。
PDFa year ago
ICML生存分析的适当评分规则
本篇论文研究了四种主要的适用于生存分析中的严格得分规则推广，并且证明了这些扩展在离散化条件下是适当的，并通过真实数据集比较了这些扩展得分规则的估计性能，发现对数分值和布赖尔分值的扩展效果最好。
PDFa year ago
分类度量标准的分析与比较
该文讨论了机器学习领域最常见的分类系统性能指标，比较了它们与期望成本和 PSR 等其他指标之间的关系，并认为后者更为优秀和高效。
PDF2 years ago
测试二元预测的评分规则
该论文构建了一个专家预测模型，研究表明适当的计分规则可以激励专家利用他们的预测来操纵世界，并提出了一类避免这一问题的简单计分规则。
PDF2 years ago
SoTeacher: 面向学生的教师网络训练框架用于知识蒸馏
提出一种基于学生的教师网络训练框架 SoTeacher，通过引入 Lipschitz 正则化和一致性正则化改善知识蒸馏算法中教师网络的训练方法，实验证明该方法适用于几乎所有的教师 - 学生架构对，并且可以显著、一致地提高学生的性能。
PDF2 years ago
适当评分规则和单调神经网络的生存回归
提出了一种基于神经网络的生存回归模型 SurvivalMonotonic-net (SuMo-net)，该方法使用时间相关权重的单调限制直接优化对数似然函数，达到了多个数据集上最先进的对数似然得分，是现有神经方法的 20-100× 计算速度
PDF3 years ago
激励相容的预测竞赛
本研究旨在通过引入两种新的预测竞赛机制，提高预测者的准确性，避免预测者为赢得比赛而夸大预测结果，并使预测者的报告与事件结果相对应。
PDF4 years ago
替代评分规则
本文提出了一种称为代理评分规则（Surrogate Scoring Rules, SSR）的方法，在私有概率信念的情况下，实现了激励兼容性和支配性诚实性，将之应用于多任务场景中，它们能够评估信息质量，即使没有绝对答案。作者通过真实数据的分析
PDF6 years ago
使用打分规则评估概率预测
本文介绍了 R 包中基于适当的评分规则进行概率模型比较评估的功能，涵盖了应用工作中的各种情况，并且提供气象和经济方面的案例研究和相关文献的指向。
PDF7 years ago
局部投票对策略投票的计算影响
本文研究了三种修改投票规则的方法，即修改计分规则、淘汰制规则和基于竞赛图的规则，并分析了部分投票对计分规则和基于竞赛图的规则中可能出现的策略投票情况及其计算复杂度。
PDF10 years ago
大脑皮层预测市场
从机制设计的角度探究皮层学习的过程，研究表明基于离散化的标准神经元模型和突触可塑性设计下，神经元会根据打分规则达到最优表现，而这些打分规则恰当而准确地表达了神经元突触权重和 Spike 单位的期望效用和高得分结果，基于这些发现，提出了一种生
PDF10 years ago
加权选举控制
本文研究加权选举结果的控制问题，通过添加和删除选民探讨了研究有分值规则的加权选举结果控制的复杂度，得到了针对许多 NP 完全情况的多项式时间算法和近似算法。
PDF11 years ago
评估概率预测
本研究提出了一种新的评估概率预测效果的方法，该方法利用损失函数以及马氏理论来评估预测结果与实际情况之间的关系。
PDF12 years ago
概率评分规则的对比
该文研究了几种评分规则，以便为概率预测模型评分或估计模型参数。研究发现，采用对数评分规则以在更不确定的情况下犯错为优势，采用球形评分规则则以在较低不确定性下犯错为优势，而其他评分规则则对两种选择都不关心。
PDF13 years ago
广告推广管理的近似算法
研究选举活动中的投票管理场景，外部方可以购买选票，目的是使其首选候选人获胜，同时尽可能少地支付，提出了一种 2 - 逼近算法，适用于大多数评分规则并且适用于加权选民，可以应用于商业环境的竞选活动管理。同时，提出了对两种 Condorcet
PDF14 years ago
基于记分规则的选举中可能获胜者问题的二分研究
本文探讨了得票规则定义的广泛类别下的可能获胜者问题的计算复杂度，发现对于除了多数制、否决制和得分向量为（2,1,...,1,0）的所有纯得分规则外，所有但一个规则在无限数量的候选人和未加权投票者情况下是 NP 完全的，而他们可以通过多数制和
PDF15 years ago