TimbreCLIP: 连接音质、文本和图像
在本文中,我们提出了一种新的框架,将神经联合抄录模型(EEND)应用于长篇音频,既不需要单独的说话者嵌入,又能够在本地和全局上实现显著的相对 DER 降低以及处理时间的计算复杂性探索。
Jun, 2024
研究了 STRIPS 规划实例之间的同构性,引入了嵌入的概念,并研究了相关问题的复杂性,证明了第一个问题是 GI-complete 的,提出了一种构建同构的算法,并通过实验表明预处理中应用约束传播可以大大提高 SAT 求解器的效率。
Jun, 2024
本文提出了一种名为 Dis-HGCN 的解缰离散超几何异构图卷积网络,旨在通过独立的信息传播来解缰语义特征和结构特征,以及通过超几何结构拉近数据分布和表示空间的差距,并在诸多真实世界异构图数据集上进行验证,结果证明其在超几何空间中解缰和表示异构图数据的有效性。
Jun, 2024
通过对话语境和反馈响应进行对比学习,本文研究了将其嵌入到相同表示空间的可能性。通过使用嵌入模型评估其在美式英语对话中作为上下文 - 反馈适当性度量和反馈响应排序的效果,结果表明该模型在相同排序任务上优于人类,且学习到的嵌入包含了反馈响应的会话功能信息。
Jun, 2024
通过使用强化学习等技术解决量子退火中的 “次嵌入问题”,该研究提出了一种名为 CHARME 的方法,包括用于策略建模的图神经网络架构、确保解的有效性的状态转换算法和有效的训练顺序探索策略。实验证明,CHARME 的效率优于 Minorminer 和 ATOM 等嵌入方法,并在某些情况下超过 OCT-based 方法。此外,提出的探索策略还提高了 CHARME 框架的训练效率。
Jun, 2024
通过在每个数字上添加编码其相对于数字起始位置的嵌入,解决了 transformers 在算术任务中表现较差的问题,并展示了该修复方法进一步提高性能的架构修改方法。通过解决位置问题,研究了 transformers 的逻辑推理能力,并发现通过单个 GPU 训练一天,仅使用 20 位数字,在 100 位加法问题上实现了高达 99% 的准确率的最新结果,并证明这种提高数字能力的方法也适用于其他多步骤推理任务,如排序和乘法。
May, 2024
通过减少模态表示学习,我们提出了一种能够为心电图信号生成与通道无关的统一表示的方法,在重构和对齐的联合优化中,我们确保不同信道的嵌入包含跨信道的整体信息的融合,同时保留其特定信息。在独立的测试数据集上,我们从不同的心电图信道生成高度相关的信道嵌入,从而在单信道嵌入中适度近似了 12 导联信号。我们生成的嵌入可以作为心电图信号下游任务的有效特征。
May, 2024
使用先进的优化算法和非线性融合,通过少量数据实现科学大语言模型的性能提升和新的最佳水平,并引入细粒度的评估方法来评估大语言模型中的虚构能力和促进负责任的使用。
May, 2024
LaT-PFN 是一种具有强大嵌入空间的时间序列模型,可以实现零点预测,并通过利用 JEPA 框架和 PFN 框架进行上下文学习来改善结果。
May, 2024
我们提出了一种监督降维方法 Gradient Boosting Mapping (GBMAP),其通过一层感知器定义的弱学习器的输出来定义嵌入,从而为监督学习任务提供更好的特征,使得简单线性模型能够与最先进的回归器和分类器相竞争,并能够自动忽略与监督学习任务无关的方向。
May, 2024