关于计算科学中中立比较研究的呼吁
本文研究使用多组学数据作为协变量自动预测结果的方法,提供了现有预测方法的文献综述,并使用13个公开的多组学数据集比较了这些方法的预测性能,讨论了这些比较性研究的结果和初步结论。
Feb, 2023
机器学习方法在临床决策中的重要性日益提升,因此解决公平性问题变得越来越迫切。尽管已经有很多工作致力于检测和改善算法偏见,但目前的方法存在缺陷和潜在危害。我们提出因果角度来研究算法偏见,强调数据集偏见的不同来源可能看起来相似,但需要采用截然不同的缓解策略。我们从盛行度、呈现度和注释差异三个因果偏见机制的角度进行分析。我们提供了一个实用的三步骤框架,用于思考医学影像公平性,支持开发安全和公正的AI预测模型。
Jul, 2023
使用生成式人工智能工具、大型语言模型(LLMs)以及文本挖掘和网络分析方法,本研究评估了生成内容的有用性,比较了生成内容与科学文献的相似性,并发现ChatGPT在文档相似性、词组及网络中心性方面优于Google Bard。此外,ChatGPT还提供了与文献中相连的术语之间的联系,有助于激发有趣的问题和生成新的假设。
Jan, 2024
人工智能系统在临床实践中有潜力革新,包括提高诊断准确性和手术决策,并降低成本和人力。然而,需要认识到这些系统可能会延续社会不公平或表现出以种族或性别为基础的偏见。为了准确可靠地应用人工智能模型于临床环境中,理解和解决潜在的偏见至关重要。通过调查生物医学自然语言处理或计算机视觉领域的最新出版物,我们对生物医学领域中应用的偏见处理方法进行了概述,并讨论了每种方法的优势和弱点。最后,我们还回顾了从一般领域中可能应用于生物医学领域以解决偏见和提高公平性的其他潜在方法。
Feb, 2024
通过研究机器学习中的数据泄露和出版偏见等因素,本研究提出了一种新颖的随机模型来估计真实准确性,并纠正了过度乐观的诊断结果,从而提供了更真实的机器学习性能评估。
May, 2024
在此论文中,我们进行了首个大规模的中性基准实验,重点关注单事件、右删失、低维度生存数据。我们对18种模型进行了评估,涵盖经典统计方法和常见的机器学习方法,并使用32个公开可用的数据集。通过性能评估,我们发现在低维度、右删失数据的标准生存分析环境中,Cox比例风险模型仍然是足够简单和强大的方法。
Jun, 2024
使用改编自国际临床试验指南的估计框架,提出一种改进评估方法的方法,用于评估AI或机器学习模型的有效性和实用性,以揭示其潜在问题、原因和解决方案。
Jun, 2024
生物医学知识、大型语言模型、假设生成、不确定性与生物医学发现是本研究的关键词和主题,在综合评估了大型语言模型作为生物医学假设生成器的能力后,研究发现大型语言模型可以生成新颖且经过验证的假设,而多智体交互和工具使用可以提高零样本假设生成的性能,并针对外部知识的类型和范围提出了需谨慎考虑的观点,为进一步研究提供了有价值的洞见。
Jul, 2024