COSET: 用于评估神经程序嵌入的基准测试

May, 2019

COSET: 用于评估神经程序嵌入的基准测试

COSET: A Benchmark for Evaluating Neural Program Embeddings

Ke Wang, Mihai Christodorescu

TL;DR本文提出一种名为 COSET 的基准测试框架，用以标准化神经程序嵌入的评估，以及通过该框架进行的研究发现可以有效识别程序语法语义特征中的挑战点及神经网络模型在处理该类挑战点时的优缺点。

Abstract

neural program embedding can be helpful in analyzing large software, a task that is challenging for traditional logic-based program analyses due to their limited scalability. A key focus of recent machine-learning

neural program embedding machine-learning program semantics benchmarking framework program transformations

发现论文，激发创造

动态神经程序嵌入用于程序修复

提出了一种基于程序执行轨迹学习的新型语义程序嵌入，相比于基于程序语法的嵌入，可以更准确地捕捉程序语义，并用于预测学生程序提交中的错误类型，并展示了通过该语义嵌入预测进行搜索的效率显著提高的结果。

Nov, 2017

关于神经程序模型对语义保持程序转换的普适性

本文通过对三个 Java 数据集和三种最先进的神经网络代码的比较，来评估神经程序模型在语义保持转换下的一般性，并发现神经程序模型在语法和外部形象不同但语义相同的程序上表现不佳。

Jul, 2020

神经代码理解：可学习的代码语义表示

本文提出了一种学习代码语义的新颖处理技术，并将其应用于各种程序分析任务中，其中使用的 Embeddings 基于独立于源编程语言的代码的 IR，现有技术不足以强烈理解程序语义。

Jun, 2018

神经程序的高效学习

以输入输出样本为基础的黑盒组件，ISED 算法通过学习神经程序的方式来估计深度神经网络参数，其性能与最先进的神经符号框架相媲美，并且在使用先前的工作基线的情况下，以更高的数据和样本效率达到了类似的准确性。

Jun, 2024

GLUECoS : 用于代码交替自然语言处理的评估基准

在一个名为，GLUECoS, 的评估基准中，使用多语境上下文嵌入模型进行评估，评估基准包括领域从文本中识别、POS 标记、命名实体识别、情感分析、问答和一项新的代码交换任务的多个自然语言处理任务。我们使用跨语言和多语言模型在所有这些任务上展示结果，并在人工生成的代码交换数据上微调多语言模型，结果表明多语言模型可以进一步针对代码交换任务进行优化，即使多语言模型比跨语言模型表现显著好，但我们的结果表明，在大多数任务中，无论是跨语言还是多种语言，微调代码交换数据上的多语言模型效果最佳。

Apr, 2020

SetCSE：使用对比学习的句子嵌入进行集合操作

通过引用集合理论，我们提出了 SetCSE，一种创新的信息检索框架。SetCSE 使用集合来表示复杂语义，并结合提供的上下文进行结构化信息查询。在该框架中，我们引入了一种集合间对比学习目标，以增强对给定语义的句子嵌入模型的理解。此外，我们提供了一系列操作，包括 SetCSE 的交集、差集和操作系列，以利用增强模型的句子嵌入进行复杂句子检索任务。本文中，我们证明 SetCSE 遵循人类语言表达的约定，显著提高了底层句子嵌入模型的区分能力，并能够通过使用现有查询方法无法实现的复杂检索任务。

Apr, 2024

高斯嵌入表示的句子表征

本文提出了一种基于高斯分布的对比学习框架 GaussCSE 用于句子嵌入，它可以处理句子间不对称的关系，同时还有一种相似度度量可以识别包含关系。实验证明 GaussCSE 在自然语言推断任务中与之前的方法一样表现出色，并能够估算蕴含关系的方向。

May, 2023

SimCSE: 简单的对比学习句子嵌入

本文介绍了一种简单的对比学习框架 SimCSE，通过无监督和监督学习两种方法，显著提高了句子嵌入的性能，适用于语义文本相似性任务。

Apr, 2021

ASET: 文本集合的即席结构化探索 [扩展摘要]

本文提出了一种名为 ASET 的新系统，允许用户以特定方式对文本集合进行结构化探索，使用含有命名实体识别器的现有抽取器首先从文本中提取信息，并使用嵌入依据用户的要求将抽取匹配到结构化表定义中，评估结果显示，ASET 能够高质量地从真实文本集合中抽取结构化数据，而无需事先设计抽取流程。

Mar, 2022

CoSiNES：用于实体标准化的对比孪生网络

使用预训练语言模型及对比 Siamese 网络构建的通用化实体标准化框架 CoSiNES，在技术、化学、医药和生物医学领域的四个标准数据集中取得了竞争性的表现，并在技术领域新数据集中展示了高准确度和快速运行时间。

Jun, 2023