- 图像中色彩和图案的通用比例定律
图像的色彩和纹理分布通过空间分辨率和动力学的级联调整得以观察。这些级联过程揭示了自然场景中完全彩色图像遵循持续线性对数标度法则的普遍属性,并且图案的熵具有不可比拟的普遍熵最大值,还有重要的神经网络、非平衡物理和光谱图像领域的研究价值。
- 全球开放建筑地图 -- 揭开全球建筑之谜
全球建筑分布与太阳能利用及全球社会经济需求和驱动因素的关系分析。
- 多重稳健的因果变化归因
比较两个数据样本,我们观察到一个结果变量分布的变化。在存在多个解释变量的情况下,我们开发了一种新的估计策略,结合回归和重新加权方法来量化每个因果机制的贡献。我们的提出方法是多重健壮的,意味着在部分错误规范化下仍能恢复目标参数。我们证明了我们 - 一种统一的傅里叶切片方法,用于推导多种深度 2 神经网络的脊波变换
通过使用傅里叶表达式得出具有各种现代网络结构的奇测变换方法,研究神经网络参数的分布。
- 简洁有效的数据增强方法用于组合泛化
数据增强方法在预训练 seq2seq 模型中对于复合泛化很有效,但仅在从正确分布中进行采样时。从均匀分布中进行采样的表现几乎与从测试分布中采样相当,并且明显优于从训练分布中采样的先前方法。我们进一步进行实验证明了这种情况发生的原因和这种数据 - 均值估计的最优性:超越最糟情况、超越子高斯、超越 $1+α$ 矩
在研究中,我们发现对于任何分布,没有合理的估计器能够在渐近情况下超过次高斯的误差率,匹配最坏情况的结果。我们引入了一个新的定义框架来分析算法的细粒度最优性,称之为 ' 邻域最优性 ',其中介于 ' 实例最优性 ' 和' 可接受性 ' 定义之 - 用于流动性流动性流动的柔性尾部,应用于金融回报数据建模
我们提出了一种能够改变分布的尾部特性的转换,受到极值理论的启发,它可以作为正则化流的一层,近似多变量重尾分布。我们将此方法应用于金融回报建模,捕捉可能在这类数据中出现的极端冲击。训练后的模型可以直接用于生成新的具有潜在极端回报的合成数据集。
- 对于无先验知识主动学习的竞争算法
针对给定的二元假设类和分布,该研究提出了一种与最优算法相竞争的无偏主动学习算法,该算法在错误率为 η 的情况下只需要 O (m^* log |H|) 的查询次数,并且证明了超越 O (log |H|) 的开销是 NP 难的。
- 评估流程中的偏见:基于优化的模型
在评估过程中,存在与个体的社会显著属性相关的偏见,我们将评估过程视为将个体对任务的真实效用分布转化为观测分布的转换,并将其建模为在信息约束下的损失最小化问题的解决方案。我们的模型有两个参数,被确定为导致偏见的因素:信息约束中的资源 - 信息 - 指纹核心位置的中心性
指纹一直以来被认为是一种独特且可靠的个人识别手段。本研究首次对大量的卷指纹和平面指纹数据集进行核心位置的经验分布进行研究,并发现核心的位置与指纹中心的偏离程度为 5.7% 到 7.6%,取决于手指。此外,研究发现卷指纹与平面指纹核心位置分布 - 探索文本地理信息规律
地理信息与人类行为、认知、表达和思维过程密切相关,并符合伽马分布。通过实验证实了伽马分布假设,并揭示了地理信息数量、长度和距离的规律。同时,地理信息的利用存在上限,还提供了地理信息提取的指导,揭开地理信息的面纱。
- 在数据异质性下实现对用户隐私的均值估计
在这项工作中,我们提出了一个简单的异构用户数据模型,允许用户数据在分布和数量上存在差异,并提供了一种在保持用户级差分隐私的同时估计总体均值的方法。我们证明了我们的估计量的渐近最优性,并证明了在我们引入的设置中可以实现的错误的一般下界。
- 使用图神经网络进行表面网格的体脂估算
使用图神经网络可以准确预测腹部内脏脂肪组织和腹部皮下脂肪组织的体积,相较于最先进的卷积神经网络,减少了训练时间和所需资源,也可以应用于廉价且易于获取的医学表面扫描替代昂贵的医学图像。
- 高斯过程探针(GPP)用于带不确定性的探测
引入了高斯过程探针 (Gaussian process probes, GPP) 框架,是一种确定模型表示哪些概念的方法,并测量其不确定性,从而为理解和评估机器学习模型的能力提供了一种数据效率高、多功能和具有不确定性意识的工具。
- ReactFace: 双向交互中多样化恰当的面部表情生成
本文提出了一种名为 ReactFace 的新框架,通过学习代表多种适当面部反应的面部反应分布,并将生成的面部反应与说话者的语言和非语言行为同步,生成多个不同但适当的逼真的人类面部反应序列。
- ACL从掩码语言模型中衍生语言模型
研究在 Masked language models 中提取出显式的联合分布的方法,并发现基于标识最接近 MLM 的条件的联合分布的方法效果最好,甚至可以有时胜过原来的 MLM 条件的出现。
- 在合成训练数据中实现物体分布的真实性以提升基于视觉的物体检测模型的性能
利用 CARLA 培训 3D 车辆检测模型并在 KITTI 上进行测试的实验表明,改善物体放置分配可以显著提高目标检测模型准确性。
- 大型语言模型中的紧急和可预测记忆
通过对 Pythia 模型套件的记忆行为进行度量和分析,发现中间检查点是模型记忆行为的更好预测因素,同时提供了有关模型和数据记忆得分分布的新颖发现
- 具有通用代价函数的神经最优输运
本文介绍了一种基于神经网络的新算法,用于计算一般的成本功能的最优输运方案和映射,该算法通过鞍点重构最优输运问题并推广到先前在弱和强输运成本功能中的方法,最终构建了一个可保存数据类别结构的数据分布映射功能。
- CAMEO: 基於好奇心擴增的都市探索最優策略
本文介绍了一种基于好奇心的 Metropolis 算法 (CAMEO),用于采样解决环境控制问题的多个最优策略,使其展现出不同的行为和风险属性,为实用和可解释性应用提供基础,也为学习多个最优策略的分布打下了第一步基础。