最大熵模型和主观趣味性:二元数据库中平铺的应用
通过 Bayesian 网络的生成模型和新颖的趣味度量,我们的方法能够从交易数据库中直接高效地推断出最有趣的项目集,并且在多个真实世界的数据集上取得与现有先进算法相当甚至更好的效果。
Oct, 2015
这篇论文介绍了如何将解释性方法扩展到具有不确定性意识的模型中,并演示了如何通过这些方法深入理解模型行为、特征对预测分布熵和真实标签对数似然的影响,以及不确定性来源对模型性能的影响。
Oct, 2023
应用机器学习模型进行决策需要区分模型所知与不知的内容。本文提供新的洞见,揭示当前预测不确定性度量的局限性,并引入了一种理论上可靠的度量方法来克服这些局限。实验证明,我们引入的度量方法在控制的合成任务中表现得更加合理,并且在利用预测不确定性的实际应用中具有优势。
Nov, 2023
本文提出了一种基于最大熵模型的算法 MTV,该算法采用迭代更新的方式发现给定数据中最丰富的项目集合,从而构建出简洁但非冗余的数据摘要,并通过实验证明其有效性。
Apr, 2019
本文分析了数据在某些自我改进但计算能力受限的主体中变得临时有趣的原因,并探讨了好奇心驱使人类、数学家、艺术家、舞蹈家、喜剧演员和人工智能等进行探索的动机。
Dec, 2008
研究提出了一种基于信息论特征的高度通用的方法,用于识别和学习多变量时间序列数据中的模式和趋势。通过在人类活动数据中分析模式变化,结果表明该方法可以提高召回率、F1 分数和准确性,在平均基线模型和更简单的模型结构下,平均减少 18.75 倍的模型参数数量。
Feb, 2023
通过奖励能够改善日益增大的数据的主观压缩性的普通增强学习程序的行动,可以自然而然地在计算机上实现所有上述内容,并且艺术家、舞者、音乐家、纯数学家的 “创造性” 可以被视为这一原则的副产品。
Sep, 2007
我们提出了一种基于核熵新颖性(KEN)得分的模式 - based 新颖性量化方法,用于多模态生成模型的新颖性评估,并通过对合成和真实图像分布的数值结果表明了该方法在检测新颖模式和比较最先进的生成模型方面的成功。
Feb, 2024
通过信息论和几何原理,我们引入了矩阵熵作为一种新的度量标准,以量化大型语言模型中的数据压缩能力,展示其在单模态和多模态设置中的适用性,并发现它可以作为传统损失缩放定律的补充。同时,我们基于矩阵熵提出了一种评估方法,用于评估对齐质量,并发现现代大型多模态模型表现出良好的对齐性能。
Jan, 2024