- 我的成为你的:在新闻采访对话中定义、注释和检测上下文相关的同义重述
研究在对话中的释义(如第一发言者:“那本书是我的。” 变成第二发言者:“那本书是你的。” )的上下文依赖释义操作和训练,提出了一个数据集和方法来对对话中的释义进行分类,通过在 NPR 和 CNN 新闻采访的话语对进行标注,得到了令人满意的用 - ACL用两步重述细调 CLIP 文本编码器
通过引入一个简单的微调方法,我们提出了一种改进 CLIP 模型对于释义的表征的方法,该方法使用大规模语言模型从 Web 规模的图像字幕中自动创建两类释义,并在固定图像编码器的同时微调 CLIP 文本编码器。我们的模型 ParaCLIP 在各 - 马拉雅拉姆语改写生成的神经机器翻译
该研究探讨了四种生成马拉雅拉姆语释义的方法,利用了英语释义和预训练的神经机器翻译模型的资源。我们使用自动化评估指标(如 BLEU、METEOR 和余弦相似度)和人工标注来评估生成的释义。我们的发现表明,自动化评估指标可能不完全适用于马拉雅拉 - 基于不同修辞结构的端到端论证挖掘
该研究使用修辞树代替词序,提出了一种深度依存分析模型来评估同一论证方案内的释义差异,并使用 RST 结构的释义作为训练数据增强,结果表明论证挖掘可以从多种言语结构变体中获益。
- AAAILAMPAT:使用对抗训练进行多语言改写的低秩调整
用低阶适配的对抗性训练方法提出了第一个无监督多语言释义模型 LAMPAT,实验证明该方法不仅在英文上效果好,还可以推广到看不见的语言。
- 通过自洽解释改进的视觉对准
使用视觉与语言模型、视觉解释方法和近义词进行微调,目标是提高定位能力和对象高亮质量。在多个数据集中,通过该方法相较于基线方法和之前的工作获得了显著的改进。
- 能否将文本修改为目标可读水平?使用零样本大型语言模型的初步研究
文本简化和增加复杂性的任务是为了提高阅读理解的测试的复杂度控制而有限的。我们提出了一种新颖的可控阅读度的文本修改任务,其中通过生成 8 个不同目标阅读度级别的版本来实现对输入文本的阅读度的绝对修改。此任务的基准是使用 ChatGPT 和 L - 从图像标题中获取释义
本文介绍了一种新的挖掘图像说明文字的方法, 构建并分析了相应数据集,证明了其作为解释的潜力,并通过算法确定了不同来源的特征地图,以识别来自不同来源的释义方式。
- 利用自然监督进行语言表示学习和生成
本论文研究了三个方面的工作:如何提高预训练模型在 NLP 任务中的性能,在维基百科和释义上利用语言结构以提取知识,以及定制文本资源以建立挑战性的评估任务。
- ACL利用释义研究上下文嵌入的特性
通过使用释义作为数据源,我们分析了上下文嵌入,特别关注 BERT。由于释义自然地编码了一致的单词和短语语义,因此它们为研究嵌入的属性提供了独特的视角。我们发现上下文嵌入可以有效地处理多义词,但在许多情况下,在语义相似的情况下,给出了不同的同 - KDD代数式单词问题的自监督释义质量检测:'John ate 5 apples' != 'John ate some apples
本文介绍了 ParaQD,采用自监督方法对 Algebraic Word Problems 中的释义进行评分,从而训练良好的释义生成模型,与现有自监督方法相比,ParaQD 的性能提高了 32%。
- ACL低资源多语言环境下的小样本可控风格转移
本研究提出一种模型来进行 few-shot 风格转换,实现在没有风格标注的语言中的低资源风格转换;并使用该模型在风格转换、情感转换、文本简化、性别中立化和文本匿名化等需求中实现了 2-3 倍的性能提升。
- 人工改写的参考文献改善神经机器翻译
本文研究采用人工生成的同义词组进行翻译评估,结果表明使用同义词组可以更好地反映人类判断,同时使用同义词组进行系统开发可以产生显著的提高。
- ACL从释义学习概率句子表示
本文定义了能够为句子产生分布的概率模型,最佳表现的模型将每个单词视为线性转换算子应用于多变量高斯分布,并通过从定义的模型中进行训练,演示了实现句子特定性的自然方式。虽然我们的模型是整体最佳表现的,但通过句子向量的范数表示来表示句子的特异性的 - 多语言神经机器翻译中使用外语重述
本文介绍如何使用包含一致结构的训练数据作为语料库级别的释义,并将释义视为外语词汇进行 Neural Machine Translation 的训练。本方法表现出比过去的单词或短语级别的方法更好的效果,并且在使用多种语言的平行释义进行训练时表 - ACL通过语法分解 AMR 生成
将从 “抽象意义表达”(AMR)生成的过程分解成两个步骤,即首先生成句法结构,然后生成表面形式,从而实现了最先进的单模型性能,同时生成了与原 AMR 图形意义相同的句法释义。
- ACL利用自然推理证明获取短语对应关系
本研究提出一种通过语义关系自然推导证明来检测词组知识的方法,利用部分变量协同作图重构以及诱导意义呈现的子图对齐算法,可自动检测各种不存在于现有词组数据库的词组,进而提高了文本推理任务的准确率。
- EMNLP学习改写以进行问答
利用释义学习问题表达的多样性来提高询问回答系统在 Freebase 和句子选择上的准确性。通过训练端到端来直接学习最有可能产生正确答案的语言表达,得到了有竞争力的结果。