entropy | BriefGPT - AI 论文速递

关键词entropy

搜索结果 - 126

稳定熵假设和熵感知解码：鲁棒自然语言生成的分析与算法
本论文提出，当语言生成模型用于文本完成，故事生成或对话建模等开放性文本生成问题时，最先进的语言生成模型可能会退化。我们发现近似平坦熵带内的生成更为 “人类化”，而模型违反熵的这些限制通常会导致退化。因此，我们提出了一种基于熵的解码算法，以生
PDFa year ago
用纠缠作为减少不确定性的方法
通过针对纯态纠缠状体的研究，我们证明了人类认知中的概念结合也存在 “非经典性的熵减” 现象，并提出了一种新的关于纠缠本质的假设，即通过纠缠实现的复合体制备其过程可以解释为 “减少不确定性的协作过程”，这可以自然地解释为什么某些量子逻辑连接是
PDFa year ago
CEnt：一种基于熵的模型无关可解释性框架，用于对比分类器的决策
本论文提出了一种基于决策树、熵、对抗性生成模型等方法的可解释性算法 CEnt，能够生成种类多样性的反事实证明，不但在可行性、达成性等方面较现有方法表现更好，并且在 MNIST、Fashion MNIST 等数据集上进一步推广并成功用于文本分
PDFa year ago
半监督双向师生学习在时变 CSI 下的室内存在检测中的应用
本文提出双向师生网络进行半监督学习，利用部分标记数据和未标记数据集组合，增强损失函数，可测距离和熵等方法识别环境变化，适应各种复杂环境下的室内人体检测，相对于现有的 SSL 模型，可以在不使用标记数据的情况下达到最高检测精度并获得与 SL
PDF2 years ago
深度强化学习中的鲁棒策略优化
本文介绍了一种名为 Robust Policy Optimization 的算法，该算法应用于强化学习中，利用扰动分布来提高策略的熵，提高探索性能，取得了比 PPO 等算法更好的性能表现，并在多个环境中表现出鲁棒性能。
PDF2 years ago
AAAI对大幅扰动输入进行惩罚并不提高问答任务中对分布外泛化的能力
针对问题回答模型在面对大幅扰动时仍能自信地给出正确答案但无法泛化到其他领域和对抗测试集的问题，本文提出通过限制多种扰动类型的模型输出熵提高泛化性能的做法，结果表明模型泛化能力随着扰动限制的增加得到一定的提升，但同时也要注意到熵最大化的副作用
PDF2 years ago
建模新兴语言中的词汇熵数学
本文提出了一个基于随机过程 FiLex 的数学模型，用于描述深度学习的新兴语言系统中词汇熵的变化，并验证了该模型对于不同环境下的超参数与熵之间的关系能够准确预测。
PDF2 years ago
噪音审计改善道德基础分类
本文提出了两种度量标准，即实例标签的熵和附注器分配给实例的标签的轮廓系数，以诊断标注噪声。在三个广泛使用的道德基础数据集上的实验表明，根据提出的度量标准删除噪声标记可以提高分类性能。
PDF2 years ago
AAAI通过流形熵估计来抑制 GAN 中的模式崩溃
本文提出了一种新的训练管道以解决生成对抗网络（GAN）中的模式崩溃问题，通过将鉴别器推广为特征嵌入并最大化鉴别器学习到的嵌入空间的分布熵，利用两个正则化项：Deep Local Linear Embedding 和 Deep Isometr
PDF2 years ago
Fokker-Planck 方程的概率流解
本文提出了一种基于概率流方程和深度学习的高维 Fokker-Planck 方程求解方法，该方法比传统的随机微分方程求解方法更加准确和稳定，并能直接给出诸如概率流、概率密度、熵等量的估计值。
PDF2 years ago
自然语言处理中通过组合标签进行信息传播
本文介绍了自然语言处理中的标注任务并定义了标签概念，在实体链接和信息流方面提出了一种新的方法，并通过熵计算信息损失，最终将其视为两个实体在图上路径的距离。
PDF2 years ago
关于信息和证明的关系
本文提出了一种基于证明的信息量度量方法，该方法以涉及待证公式的可能证明集合（即 “知识库”）定义概率度量，使用熵的方法计算信息量。
PDF2 years ago
复杂系统分类的方法：文字、文本等
通过物理学类比，定义了基于温度、化学势、熵等参数的文本分类，提出在语言学类比的基础上，研究基因组的方法，同时讨论了熵作为文本分类参数的作用和意义。
PDF2 years ago
ACL语言生成中概率 - 质量悖论
论文分析了自然语言生成过程，并通过信息理论解释了高概率和高质量并不总是一致的现象，得出语言生成应包含接近自然字符串分布熵的负对数概率数目，初步实证结果表明高质量的文本具有信息量与自然字符串分布熵更接近的特点。
PDF2 years ago
评估神经语言模型中的分布扭曲
我们发现，LSTM 和 Transformer 语言模型系统地低估了来自目标语言的序列的概率，并且对于不太可能出现的序列更为严重，尽管使用更多的训练数据减轻了这种倾向，但这种低估行为还是存在，并且在目标分布熵较低时加剧了这种情况，并且找到了
PDF2 years ago
SNNs 中的集成可塑性和网络适应性
介绍了一种新的基于熵和网络激活的集成学习方法，该方法与仅使用尖峰活动操作的尖峰率神经元修剪技术相结合，用于处理两个脑电图数据集进行分类实验，结果表明这种修剪低尖峰率神经元群集导致更好的泛化能力。
PDF2 years ago
CVPR利用不可靠的伪标签进行半监督语义分割
本研究提出了一种通过利用熵值对可靠像素和不可靠像素进行分类，再进一步将不可靠像素分配为负样本，从而对无标签数据进行半监督语义分割的有效策略
PDF2 years ago
提高用于短且嘈杂时间序列的 NNetEn 熵计算的新技术
本文提出了一种新的熵度量学方法 —— 神经网络熵（NNetEn），它能够有效应用于实际环境下带有噪音信号的测量，本文的研究主要围绕着 NNetEn 的计算方法及其在时间序列、噪声和常数偏差方面的表现进行了分析。
PDF2 years ago
随机排列集的最大熵
本研究提出了随机置换集（RPS）的最大熵原理，并通过数值实验验证，结果表明最大熵的 RPS 与最大邓（Deng）熵和最大香农熵相容。当排列事件中元素的顺序被忽略时，RPS 的最大熵将退化为最大邓熵；当每个排列事件被限制为仅包含一个元素时，R
PDF3 years ago
ICML通过马尔可夫决策过程进行通信
本文介绍了一种被称为 Markov 编码游戏 (MCG) 的方法来处理在分散控制环境下进行通信的问题，并且介绍了一种新的理论算法 MEME 来进行最大熵强化学习和最小熵耦合的平衡。同时进行的实验也表明了这种算法在解决小型和大型 MCG 问题
PDF3 years ago