- 高维贝叶斯优化离散序列的调查与基准
通过统一的框架和标准化的黑盒函数,针对化学和生物学的实际应用领域,该论文研究了贝叶斯优化的高维优化方法和技术难点,并提供了易于拓展的软件库,以方便实践者更好地应用于离散优化问题。
- 从模型性能到声明:机器学习可复现性的焦点转变如何帮助弥合责任鸿沟
通过将模型性能可复制性转变为主张可复制性,可以使机器学习科学家对产生不可复制的主张负责并对其造成的滥用和误解负责,从而缩小责任差距。
- 基于机会成本探索的数据交易链构建
数据交易市场与传统市场的比较,重点在于数据的可复制性和隐私对数据交易的影响。研究了数据复制性对传统微观经济学中机会成本概念的基本改变,并探讨了如何在不损害数据隐私的情况下最大限度地利用这种变化。提出了在隐私领域链内数据流通的约束,并提供了一 - MLXP:Python 中可复制机器学习实验的框架
利用 MLXP 工具,可以简化实验流程,降低操作难度,并确保高度的复现性。
- 语言模型即服务模式下的 ARRT:新范式综述及挑战
现有的一些强大的语言模型通常是专有的系统,只能通过(通常是有限制的)网络或软件编程接口来使用。本文旨在界定这些挑战对 LMaaS 的可访问性、可复制性、可靠性和可信度(ARRT)造成的影响,并对当前解决方案进行系统性考察并提出建议,同时提供 - 强化学习的可复制性
探讨强化学习领域中复制性的数学研究,提出了基于生成模型下的可复制性 RL 算法,其中包括一个有效的 $
ho$-replicable 算法和一个可计算的近似可复制的算法。
- 预测规则的可重复性定义
本文提出了一种基于多智能体框架的方法来定义机器学习中预测规则的可复制性,旨在提供更系统的评估复制性的指导,关注一致结果在典型利用情境中的含义。
- 表格结构识别方法的可重现性和可复制性研究
本文考察了人工智能表格结构识别领域中 16 篇已发表论文的可重现性和可复制性,通过使用原始作者提供的代码和数据集尝试复现其结果,并采用类似数据集和新数据集进行复制性检查,检验结果表明只有其中 4 篇论文的结果与原始相符,其中 2 篇论文的可 - 学习中的可复制性和稳定性
本文研究了机器学习中的可复制性问题,提出了全局稳定性和列表可复制性的概念,并表明在除一些特殊情况外,大多数算法必须具有一定的随机性以实现可复制性。
- 锚定回归:异质数据迎接因果关系
本文研究了在训练数据与测试数据分布不同的情况下,利用 anchor regression 方法通过使用外生变量来预测响应变量,并提高其可复现性和分布鲁棒性。
- Twitter 数据集持续性的纵向评估
研究了 30 个推特数据集,发现尽管可用推文的比例随着数据集的老化而降低,但回收到的子集的文本内容仍然在很大程度上代表了最初收集的整个数据集。与此同时,元数据的代表性随时间而减少,这对使用公共的推特数据集的研究人员有重要意义。