限制性反馈带来额外性能收益

Apr, 2023

Earning Extra Performance from Restrictive Feedbacks

Jing Li, Yuangang Pan, Yueming Lyu, Yinghua Yao, Yulei Sui...

TL;DR提出面向反馈的机器学习模型调优挑战 (EXPECTED)，并针对深度模型引入了针对参数分布的几何特征及更高效的层次调优算法，通过实验验证了该算法的准确性和有效性。

Abstract

Many machine learning applications encounter a situation where model providers are required to further refine the previously trained model so as to gratify the specific need of local users. This problem is reduced to the standard →

machine learning model tuning feedback deep learning query-efficient algorithm

发现论文，激发创造

随机搜索超参数调整：期望提升估计及其相应的下界

本文研究神经网络超参数的调参方法及其期望准确度的提升和估计问题，并使用基于随机搜索方法和固定分布进行的超参数采样来检验估计值，发现最优的期望准确度估计仍有 1/k 的误差。

Aug, 2022

跨越人类数据：以语言模型扩展自我训练的问题解决能力

本论文探讨了基于期望最大化的简单自我训练方法 ReST$^{EM}$，在数学问题和编码基准测试中使用 PaLM-2 模型，细调模型，获得了在模型尺寸上的有利规模效应，并且明显超过仅使用人工数据的细调方法，总体而言，研究结果表明利用反馈进行自我训练可以大大减少对人工生成数据的依赖。

Dec, 2023

随机变量的最大值的预期验证性能和估计

本文分析了预期验证性能的三个统计估计方法在计算预算方面的效果，并在合成和现实情况下对三个估计器进行评估。其中，无偏估计器具有最高方差，方差最小的估计器具有最大的偏差；最小均方误差的估计器在偏差和方差之间取得了平衡，呈现出经典的偏差 - 方差权衡。我们使用预期验证性能来比较不同模型，并分析每个估计器导致选择哪个模型表现最佳的错误数量。我们发现两个有偏估计器导致最少的错误结论，这提示了最小化方差和均方误差的重要性。

Oct, 2021

展示你的工作：实验结果的改进报告

通过使用验证数据和计算预算等指标，本文提出了一种新的模型比较方法，从而帮助实现更好地汇报实验结果和确保未来准确对比。

Sep, 2019

利用执行反馈的懊悔最小化

本文研究了在 performative 情境下找到接近最优点的模型的问题，该算法在找到最优解的同时还能保证低的后悔值，并通过对分布性的探索来构建风险置信度，从而建立了一种利用 bandits 算法来实现 performative 反馈下的后悔最小化的概念方法。

Feb, 2022

有状态世界中的执行预测

本文提出了一个理论框架，建模了目标人群对已部署分类器的响应，同时研究了基于重复风险最小化和一种更懒惰的方法的两个重新训练算法的收敛性，能够更好的控制已部署分类器的影响，同时探讨了不同人群获取信息和资源的差异对已部署分类器的响应影响。

Nov, 2020

使用语言反馈进行语言模型训练

通过从自然语言反馈中学习，本文提出了一种三步学习算法来通过对其输出的反馈来优化预训练语言模型，以获得人类水平的摘要能力。

Apr, 2022

从预测到行动：适当性能估计在基于机器学习的材料发现中的关键作用

通过统计性属性模型驱动的材料发现是一个迭代决策过程，在此过程中，初始数据集会根据模型所提出的新数据进行扩展，目标是随时间最大化某种 “奖励”，例如迄今为止发现的最大属性值。我们证明了此问题，并提出了一种新颖的性能估计方法，即与基于预计算数据集的 “期望改善” 收购函数预测高斯过程，在双钙钛矿氧化物的示例研究中表现最佳。

Nov, 2023

利用解释指导模型

本研究探讨了模型指导方法在 PASCAL VOC 2007 和 MS COCO 2014 数据集上的有效性以及提出了一种新的能量损失方法，证实了模型指导方法可以通过正则化模型的解释，集中于正确的特征，提高模型性能。

Mar, 2023

生成模型的自动评估与指令调优

基于指令调优的学习度量可以提供自然语言生成的自动评估，通过对多任务的联合训练，可以进一步改善性能，对未来的少量或无人标注数据的任务具有积极意义。

Oct, 2023