- 机器学习中的长期公平性调查和追求:定义、方法和挑战的综述
通过研究现有文献,本调查从不同角度回顾了长期公平性的研究,并提出了一个分类法。我们突出了一些关键挑战,考虑了未来的研究方向,分析了现有的问题和潜在的深入探索。
- FFCL:前馈 - 前馈神经网络与皮层回路,边缘上的训练与推理,无需反向传播
通过优化标签处理、修改标签整合方式以及引入反馈循环,提升了前向前向学习算法在训练神经网络中的性能。
- 从不完整数据学习循环因果模型
在本研究中,我们提出了一种名为 MissNODAGS 的新框架,用于从部分缺失的数据中学习循环因果图。通过合成实验和真实的单细胞干预数据,我们证明在部分缺失的干预数据上使用最先进的填充技术后进行因果学习相比之下,MissNODAGS 表现出 - 语言模型的反馈循环驱动上下文奖励黑客
语言模型相互作用中的反馈循环可能会导致上下文激励欺骗 (ICRH),这涉及输出改进和策略改进两个过程,而评估静态数据集是不充分的,因此需要采取三项评估推荐措施来更全面地理解和捕捉 ICRH 行为。
- 提升大型语言模型性能以更准确地回答问题和提取信息
通过精调模型和对称相似度、LLM 评估和 Rouge-L 分数等指标的连续反馈循环来提高人工智能模型,利用金融数据集和检索增强生成技术 (RAG),证明精调模型在问题回答能力方面能够超越零 - shot LLMs 的准确性。
- 循环模型中带有隐藏共变量的因果发现方法的比较研究
对稀疏线性模型中具有循环和隐藏混杂因素的因果关系进行比较研究,评估了四种因果发现技术在多个干预设置和不同数据集规模下的性能。
- 探索检索器和大型语言模型的整合策略
本文旨在研究不同的方法将检索到的段落与大型语言模型相结合,以提高答案生成能力,并通过综合分析和实验证明了有效利用检索到的段落来增强大型语言模型答案生成能力的见解。
- 自动决策系统中反馈环路分类及其与偏见的关系
本文运用动态系统理论对基于机器学习的决策制定流程中的不同类型的反馈循环进行分类,为研究反馈循环提供了一个统一而有原则性的框架;通过定性分析和推荐系统的模拟示例,我们还发现了在 ML 偏见中存在哪些有可能会持续、加强或减少。
- 动态因果协同过滤
本文提出了一种具有循环过程的因果图并使用马尔可夫过程分析了回音室等数学特性,设计了一种动态因果协作过滤模型来减轻回音室现象并通过多次实验证明其优越性。
- 具有循环的关系因果模型:表示和推理
本文介绍了一种新的关于环形关系因果模型的表示方法和推理方法。通过引入关系 σ 分离的新标准,以及一种新的提升表示,σ- 抽象地面图,帮助在所有可能的实例化中抽象统计独立关系。我们还表明,基于 σ-AGG,关系 σ 分离对于任意长度的一个或多 - 纠正链接推荐的曝光偏差
研究说明链接预测方法在推荐系统中的广泛应用,但当用户系统性地遭受某些相关项目的低曝光时,可能出现曝光偏差。 该研究提出了一种通过已知曝光概率来减轻这种偏差和随之而来的反馈循环的估计器,并提供了一种用于从数据中学习曝光概率的损失函数,经过实验 - 从连续平衡数据中的周期性因果发现
本文提出了一种无需假设线性关系和处理反馈环的方法来学习连续数据中的环形因果模型,并在生化反应的背景下提出了一种新的建模干预的方法。通过运用该方法对 Sachs et al. (2005) 流式细胞术数据进行重建,证明了该方法在发现环形反馈和