命题化与嵌入：等价的两面硬币

Jun, 2020

Propositionalization and Embeddings: Two Sides of the Same Coin

Nada Lavrač, Blaž Škrlj, Marko Robnik-Šikonja

TL;DR本研究介绍了数据预处理在机器学习中的重要性，并提出了一种融合不同输入数据类型和格式的现代数据处理技术，重点介绍了命题化和嵌入式数据转换方法，并提出了将两种方法统一的框架和方法，这有助于解决复杂的数据转换和学习任务。通过两种高效的实现方法，实验证明了该方法的有效性和优越性。

Abstract

data preprocessing is an important component of machine learning pipelines, which requires ample time and resources. An integral part of preprocessing is →

data preprocessing machine learning data transformation propositionalization embedding

发现论文，激发创造

将复杂性嵌入数据表示而非模型：异质医学数据案例研究

本文提出使用语义嵌入方法，将原始、杂乱的临床数据直接与下游学习架构耦合，以实现最小化预处理。我们从捕捉和编码数据表示中的复杂数据依赖性的角度考虑这一步骤，而不是在模型中实现，该方法允许使用快速，轻量级和简单的模型进行下游处理，对于没有机器学习专业知识的研究人员非常有用。我们通过三个典型的临床预测任务证明了高度压缩的嵌入数据表示捕获了大量有用的复杂性，尽管在某些情况下，压缩并非完全无损。

Feb, 2018

关系嵌入的提升规则注入

本文提出了一种高效的基于关联规则的方法，将实体元组嵌入映射到近似布尔空间中，通过从 WordNet 中进行的关联规则挖掘来鼓励关系嵌入上的部分排序，以实现自动化知识库的构建。通过引入少量的常识规则，相较于矩阵分解基准方法，实现平均精度的 2 个百分点的提高，并观察到运行时间几乎没有增加。

Jun, 2016

通过深度图嵌入进行定理证明的前提选择

该研究使用基于深度学习的方法，提出了一个新的思路来选择与证明相应的数学陈述。应用了一种新的嵌入方法，将高阶逻辑公式表示为一个不变于变量重命名的图，并在保留语法和语义信息的同时，全面地将图形嵌入到一个向量中，从而在 HolStep 数据集上实现了优异的分类表现，将分类准确度从 83％提高到了 90.3％。

Sep, 2017

将符号知识嵌入深度网络

本文提出了一种基于图嵌入网络的符号知识应用方法，该方法将命题公式 (和赋值) 通过增强的 Graph Convolutional Network (GCN) 投射到流形上。通过识别节点异质性和结构约束等技术，我们能够生成语义上忠实的嵌入，提高推理检查和视觉关系预测模型的性能。有趣的是，我们观察到命题理论表示的可处理性与嵌入的易用性之间存在一种联系。

Sep, 2019

SuperTML：用于结构化表格数据的二维词嵌入

本文提出了 SuperTML 方法，通过采用两维度嵌入超级字符的思想，将表格数据进行二维嵌入，然后使用 fine-tuned 二维 CNN 模型来解决分类问题。实验结果表明，该方法在大型和小型数据集上都取得了最先进的结果。

Feb, 2019

知识图谱嵌入的通用预处理操作

本文提出了一组通用预处理算子，可以用于将具有数字、时间、文本和图像信息的知识图谱转换为任何方法可嵌入的形式。在 kgbench 数据集上，使用三种不同的嵌入方法进行实验，结果显示出良好的效果。

Sep, 2023

Tsetlin 机嵌入：用逻辑表达式代表单词

本文提出一种利用命题逻辑表示单词语义的词嵌入方法，使用 Tsetlin 机器自编码器进行学习，探讨了其在自然语言处理领域中的重要性，对比了其他模型，研究表明在多项分类任务中表现良好，且具有一定的可解释性。

Jan, 2023

通过数据转换提升机器学习系统的鲁棒性

本文研究在机器学习分类器中针对规避攻击采用数据变换作为一种防御方法。我们提出并探索了包括主成分分析的降维和数据反白化在内的各种数据转换策略，以增强机器学习的韧性，在多个真实数据集上评估和演示了数据的线性转换作为一种抵御规避攻击的有效防御机制，并在不同应用领域得到了验证。

Apr, 2017

关系蕴含的概率模型

通过构建一个概率模型，该论文提出了一种新的关系推导框架，提高了在相关数据集上的推导分数；此外，该论文还提供了两个用于帮助未来研究的实用资源：一种改进的判定数据集框架和一个包含 17848 个标记实例的公共数据集，其标记的精度从 53％提高到了 95％。

Jul, 2019

构建可逆的语义保留逻辑公式嵌入

该研究工作探讨了如何使用基于图变分自编码器 (Graph Variational Autoencoder) 的深度架构来训练学习逻辑嵌入，以实现对逻辑嵌入的反向推理，即将嵌入空间中的逻辑公式反向映射回语法空间，进而提高机器学习中学习逻辑规则和性质的能力。

May, 2023