预测规则的可重复性定义
本文回顾了当前关于 Artificial Intelligence 的可重复性的文献,并强调了未解决的问题。作者提出了一些建议来提高模型重复性,特别是涉及生物医学和物理人工智能领域的问题。
Feb, 2023
本文介绍了 2019 年 NeurIPS 会议针对机器学习研究推出的可重复性计划,包括代码提交政策、全社区可重复性挑战和将机器学习可重复性清单作为论文提交过程的一部分,阐述了每个组件的部署以及我们从这个计划中学到了什么。
Mar, 2020
本文介绍了一项对于基于句法的方面级情感挖掘的三种著名算法的经验可重复性研究,表明由于预处理和参数设置缺少细节以及缺乏可用的代码实现以阐明细节,再现结果仍然是一项困难的任务,这是该领域的重要研究威胁。因此,鼓励代码驱动的研究在帮助研究人员更好地理解最新技术意义和生成持续进展方面具有关键作用。
Jan, 2017
该论文提出了一种重复性分析框架,用于对 NLP 任务算法的多个比较进行统计学分析,相对于 NLP 文献中目前未经统计证明的传统做法具有显著的理论优势,并通过多个应用案例展示了其实证价值。
Sep, 2017
本研究旨在解决自然语言处理中重复性和普适性问题,并以目标相关情感分析为例,证明最近该领域的工作缺乏足够的代码共享和方法描述,缺乏对数据的可比性和泛化性。研究人员运用三种互补方法进行了第一次再现研究,并在六个不同的英文数据集上进行了第一次大规模评估,推荐未来考虑多种数据集、发布代码,以便最大程度上减少使可重复性和普遍性困难的障碍。
Jun, 2018
通过将模型性能可复制性转变为主张可复制性,可以使机器学习科学家对产生不可复制的主张负责并对其造成的滥用和误解负责,从而缩小责任差距。
Apr, 2024
本文回顾了行为和社会科学领域以及 DARPA SCORE 项目中使用的方法,特别关注人类预测复制结果的作用,以及预测如何利用相对劳动力和资源密集的复制所获得的信息。探讨了使用这些方法来监测和改进计算机科学,人工智能和机器学习领域中研究可信度的机会和挑战。
May, 2020