- 导航公正:AI/ML 发展中从业人员的理解、挑战与策略
AI 实践者对 AI/ML 的公平性的理解、挑战、后果和策略以及进一步研究领域的识别,为确保 AI/ML 的公平性提供了宝贵的真实世界视角。
- 深度学习测试中的风险:普遍性、影响和建议
这篇论文调查了机器学习测试中常见的实证评估隐患,通过敏感性分析展示了这些隐患对实验结果的重要性,并提出了一套良好的实证实践以减轻这些隐患的影响。这项研究对软件工程社区的共同问题和良好实践进行了初步调查,并在深度学习测试领域为实证研究设定了特 - 端到端语音到文本翻译中一致性正则化的实证研究
通过经验研究,本文针对端到端语音转文本翻译提出了两种训练策略:SimRegCR 和 SimZeroCR,以实现一致性正则化的最新性能。在 MuST-C 基准测试中,在大多数翻译方向上,我们的方法取得了最先进的性能。分析证明,由内部一致性带来 - 生成式检索模型的稳健性:一种越界的视角
本文通过定义三个角度的 OOD 鲁棒性来分析多个代表性的生成式检索模型和密集型检索模型的 OOD 鲁棒性,并得出生成式检索模型需要提高 OOD 鲁棒性的结论。
- 学习与进化:影响有效结合的因素
这篇论文通过一系列实证研究探讨结合学习和进化是否比单独使用进化更好,结果表明引入噪声可以改善此过程。
- 协同构思中的增强集体智能:议程和挑战
研究探讨使用增强的集体智能的应用,结合人类和大型语言模型在协同创意中的表现,进一步介绍了一个名为 Polis 的实时集合工具,并总结出三个挑战以期设计并完成实验。
- 神经网络是否真的编码符号概念?
本文探讨了神经网络模型中输入变量之间互动和由此定义出的概念所代表的意义是否真实可靠,经过大量实证研究,发现训练良好的神经网络模型往往可以获得稀疏、可转移和有区分性的概念,这部分与人类观点相符合。
- COLING具有隐式用户人设检测的个性化对话生成器
提出了一种基于用户人格检测的个性化对话生成器,该方法使用条件变分推理建立用户潜在人格模型并利用后验鉴别正则化提高训练效果,在实证研究中实现比现有技术更高的对用户人格关注和提升了对话品质的效果。
- 图形对比学习的实证研究
本文提出了一种利用 Graph Contrastive Learning 无人工标注学习图形表示的新范式,并通过对一系列基准任务和各种领域的数据集进行广泛、可控的实验,研究不同的 GCL 组件之间的相互作用,得出了一套有效 GCL 的一般特 - ICLR通过函数平滑证明强化学习的稳健策略
本文介绍了一种名为 CROP 的统一框架,该框架旨在提供针对行动和奖励水平的稳健性认证,通过局部平滑算法和全局平滑算法来保证措施的鲁棒性。CROP 被用于评估几种现有的 RL 算法,包括 Atari 游戏和 Highway、CartPole - MM配置知识工程的推荐系统
本文介绍了推荐系统如何支持知识库的开发和维护,讨论了在知识工程领域中采用推荐系统的几种情景,并报告了一些实证研究结果,这些结果表明用户中心的配置知识组织对于这些系统的重要性。
- IJCAI在嘈杂环境下实现准确且稳健的领域适应
本文提出了一种使用离线课程学习和代理分布的边际差异方法来消除标签噪声和特征噪声的领域自适应算法,并将其无缝转化为一个对抗网络进行联合优化,在存在噪声的环境下,与现有技术相比取得了超过 10%的准确度提高。
- 澄清去混淆理论
本文研究多重因果推断并提出去卷积算法。研究讨论了理论要求并呈现了实证研究。几个关于去卷积理论的改进已被提出,其中包括了 Imai 和 Jiang 澄清了 “无未观察到的单因素混淆因素” 的假设,本文在此基础上进一步澄清理论。此外,Ogbur - 校准和修剪:通过预测校准提高彩票票据的可靠性
本文首次研究了过参数化网络中显式置信度校准对产生的 Lottery Tickets 的影响,并发现采用校准机制可以更有效地提高准确性和校准度。
- 基于时序卷积神经网络的概率预测
本研究基于卷积神经网络提出了一种概率预测框架,可用于多个相关时间序列的预测,并可在参数和非参数设置下估计概率密度。该方法通过堆叠残差块实现了序列的时间依赖关系,并通过表示学习捕获了季节性、假日效应等复杂模式,实验证明该框架在精度和效率方面均 - 利用历史知识适应概念漂移
这篇论文介绍了一种新的集成学习方法,称为 Diversity and Transfer based Ensemble Learning(DTEL),用于处理概念漂移的增量学习。通过利用保留的历史模型和转移学习,DTEL 可以更有效地处理概念 - 将风险最小化技术应用于标签噪声的容错性
本文研究了在训练数据中存在标签噪声的情况下,风险最小化的鲁棒性。我们探讨了一种损失函数对于噪声的容忍度,并证明了 0-1 损失、Sigmoid 损失、Ramp 损失和 Probit 损失满足该条件,其中选择足够大的参数可以使其对非均匀标签噪 - 社交传染的简单规则
本文研究了信息传播的社会传染模型,并通过对两个不同的社交媒体网站 Twitter 和 Digg 的用户响应进行比较,证明了信息暴露的位置对社会传染的影响非常大。通过考虑信息在用户界面上的可见性,可以显著简化社会传染的动态模型,并且发现信息暴 - 限价订单簿
本文概述了大量实证和理论研究在限价订单簿上取得的洞见,探讨了统计分析历史价位和数量数据所报告的研究结果,说明了许多 LOB 模型并不像真实 LOB 一样。此外,我们还发现了一些关键未解决问题。
- 叙事中的视角追踪
本文探讨通过算法追踪小说文字中的心理视角问题。通过对自然出现的叙述的详细研究,发现了作者操纵视角的几种规律,并提出了一种算法来跟踪文章中的视角。作者通过实验研究表明了这种算法的有效性。