- 四元数生成对抗神经网络及其在彩色图像修复中的应用
本论文提出了一种基于 Quaternion Generative Adversarial Neural Network(QGAN)模型及其相关理论的方法,用于解决颜色图像修复中存在大面积缺失的问题,并经实验证明在这种情况下,QGAN 具有较 - 检查 LLM 评估对基准分布假设的鲁棒性
基准测试作为评估大型语言模型(LLMs)的核心方法已经出现。研究界通常依赖于模型在基准测试的测试提示中的平均性能来评估模型的表现。这一点符合一个假设,即基准测试中的测试提示代表来自真实世界的感兴趣的分布的随机样本。我们注意到这一点通常并不成 - COLING简单变得更难:LLMs 在简化语料库上表现出一致的行为吗?
简化文本以提高阅读能力,保留原始内容和意义。通过比较预训练分类器在原始和简化输入上的预测,研究发现所有语言和模型之间存在令人担忧的不一致性,简化输入很容易被利用来进行零迭代、与模型无关的对抗攻击,成功率可达 50%。
- 针对特定图像增强技术演化的损失函数
通过进行演化搜索找到了一种名为逆贝塞尔对数损失的单一损失函数,它在多数实验中表现优于交叉熵。
- 通过图学习的模型动物园进行模型选择
通过分析预先训练的深度学习模型的元数据,并捕捉模型和数据集之间的内在关系,研究人员提出了一种名为 TransferGraph 的新框架,将模型选择问题重新定义为图学习问题,并在 16 个真实数据集上进行了广泛实验,发现相较于现有方法,Tra - 我们是否可以通过神经崩溃来理解可塑性?
本文探讨深度学习中两个最近发现的现象之间的联系:可塑性损失和神经崩溃。我们分析了它们在不同场景中的相关性,揭示了在第一任务的初始训练阶段存在显著关联。此外,我们介绍了一种规范化方法来减轻神经崩溃,证明了它在这种特定情况下减缓可塑性损失的有效 - 复杂性是否是幻觉?
简单性与泛化之间存在相关性,但简单性并不直接影响泛化;在没有抽象层的情况下,所有形式具有相等的复杂性,但在空间和时间上扩展的抽象层中,简化约束的形式可以提高泛化效果。
- 不同语篇注释框架之间的自动对齐
利用标签锚定对比学习方法,通过学习标签嵌入来映射不同框架中的语篇关系。
- 学术智能的 LLMs 不一定具备社交智能
基于真实社会场景开发了标准化的社交智能测试,评估了大型语言模型的社交智能,发现社交智能仍有改进的空间,且其与学术智能存在较低的相关性,并受到社会因素的影响。
- Impression-CLIP:用于字体的对比形象嵌入
通过使用 CLIP 模型,我们提出了 Impression-CLIP,用于捕捉字体形状和印象之间的弱关联。实验证明 Impression-CLIP 在字体与印象之间的跨模态检索中取得了更好的准确度,同时展现了对噪声和缺失标签的稳健性。
- EE3P:事件驱动的周期性现象属性估计
使用事件相机对周期性现象进行测量的一种新方法,通过计算事件空间中时空窗口的相关性来估计频率,并通过峰值之间的时间差计算周期,该方法是非接触的且无需标记物,评估结果显示在周期性现象的三个实例中,相对误差低于 0.04%。
- 从统计角度重新审视数据集偏差问题
从统计的角度研究了 “数据集偏差” 问题,发现问题的主要原因是输入 x 中类属性 u 与非类属性 b 之间的强相关性,通过 p (u|b) 与 p (u) 之间的显著差异来表示。基于最大对数似然(MLL)目标对偏差数据集进行训练的模型将这种 - 相关随机向量的检测
研究标准正态随机向量之间是否存在相关性的假设检验问题,提出了信息理论下界的评估方法,同时探索了多维情况下观察两个数据库 / 矩阵之间的部分相关性。
- 基于经验动力建模的因果检测综述
通过非线性动力学和时间序列数据,本文利用经验动力学建模(EDM)探索动态系统内变量之间的因果关系检测。通过重构动态系统的演化状态,可以有效地建模这些系统,从而提取变量 X 引起变量 Y 的因果信息。本研究强调了相关性和因果关系之间的辩证关系 - 解耦文本到 SQL 的 SQL 查询难度解析
通过解耦 SQL 查询的难度分析问题和模式,我们引入了一种创新的基于 Text-to-SQL 的框架,将多难度任务简化为单一难度挑战,大大降低了语言模型的解析压力,并在 Spider dev 上实现了新的最新的性能。
- 训练和测试中的上下文一致性与同步机器翻译
机器同时翻译(SiMT)旨在实时产生一个具有单调增长源侧上下文的部分翻译。然而,存在一个关于训练和测试之间上下文使用的反直觉现象:例如,以 wait-k 一致训练的 wait-k 测试模型在翻译质量方面明显劣于以 wait-k'(k' 不等 - 我的狗和我之间的声学相关性
研究狗叫声与主人语言环境之间的相关性,利用 Shiba Inu 犬的数据集,通过分类任务和显著因素分析,发现两种语言环境下狗叫声的显著声学差异,并识别了一些潜在与它们主人语言模式相关的声学特征。
- 基于动态领域适应的深度学习网络用于基于脑电信号的动作意象分类
我们提出了一种基于动态领域自适应的深度学习网络 (DADL-Net),通过 3D 卷积模块将脑电数据映射到三维几何空间,并学习其时空特征,利用空间通道注意机制加强特征,最终通过卷积模块进一步学习特征的时空信息。通过引入最大均值差异损失函数, - 利用 Twitter 数据确定飓风等级:一项实验
此研究通过数据挖掘方法在社交媒体数据和灾害严重程度之间找到关联,并使用特定区域的 Twitter 数据预测该区域的飓风等级。
- GPT-3 的拓扑解读
通过使用不同的嵌入方法研究句向量与句子语义之间的相关性,我们观察到不同嵌入空间中相同句子的相关性以及相同嵌入空间中不同句子的相关性,这些观察结果与我们的假设一致并引领我们进入下一个阶段。