计算生成俚语的框架

Feb, 2021

A Computational Framework for Slang Generation

Zhewei Sun, Richard Zemel, Yang Xu

TL;DR本文介绍了一种基于概率推理和神经对比学习的框架，通过编码与传统语言和语境相关的新颖俚语意义的方式建立一个模型，旨在机器生成俚语，结果表明这种方法不仅优于现有的语言模型，而且更好地预测了 1960 年代到 2000 年代俚语词语使用的历史演变趋势，为自然语言的自动化生成和解释打下了基础。

Abstract

slang is a common type of informal language, but its flexible nature and paucity of data resources present challenges for existing natural language systems. We take an initial step toward machine generation of slang

发现论文，激发创造

英语俚语中的简单单词构建模型

本文提出一些生成模型，用于解决英语俚语中三种额外语法字形形成的现象，这些模型表现良好。

Apr, 2018

利用本地和全局语境学习短语描述

本研究旨在回答机器学习是否能较好地处理文本中的未知词汇以及哪种上下文对于机器来说更为重要的问题，通过构建一个由两个上下文编码器和一个描述编码器组成的神经模型，本研究证明了在处理非标准英语解释和定义生成时，全局上下文与分布在本地文本中的线索都是对于机器有用的。

Nov, 2018

薛定谔树--论语法与神经语言模型

本文回顾了近年来自然语言处理领域的语言模型的发展，并探讨在研究语言模型中基于句法的研究中存在的问题以及解决方案，旨在为未来语言模型的研究提供一种较为多样化和立体化的研究视角。

Oct, 2021

Slangvolution: 俚语中语义变化和词频动态的因果分析

通过因果关系的镜头来研究语言的演变，我们分析了俚语词和非俚语词的语义变化和频率转移，发现俚语词虽然语义变化较小，但频率转移较大。

Mar, 2022

语义驱动的俚语解释

本研究提出一种基于语义信息的俚语解释方法 (SSI)，通过考虑候选解释在语境和语义上的适当性，实现了在英语俚语解释方面的最新技术，同时优雅地在缺乏数据的零样本学习和少样本学习中使用。此外，该方法还成功应用于英语俚语的机器翻译中，为自动化解释和翻译非正式语言打开了机会。

May, 2022

追踪俚语中的语义变化

本文使用计算模型通过测试历史性俚语词典词条，探究并表征美国和英国二百年来俚语用法地理变异的规律，并提供了历史文化元素在俚语自然语言处理中的应用的机会。

Oct, 2022

俚语表达方法研究

将不同的表示学习模型和知识资源结合起来，研究下游任务对俚语理解的依赖关系。实验表明，预先在社交媒体数据上训练的模型优于仅针对静态词嵌入的字典的影响。我们的错误分析确定了俚语表示学习的核心挑战，包括词汇表外单词、多义词、变异和注释不一致。

Dec, 2022

大语言模型的新概念理解

提出了一个新的基准SLANG，评估语言模型对于理解互联网上新兴语言趋势的能力，并提出了基于因果推断的方法FOCUS，它通过研究语言变化的真实例子来增强语言模型对于新短语和用法模式的理解。实证分析表明，基于因果推断的方法在解释互联网俚语和表情包时，准确性和相关性方面优于传统模型。

Jan, 2024

走向非正式语言处理：大型语言模型中的俚语知识

通过影视字幕构建了一个用于评估俚语处理的数据集，展示了该数据集在俚语检测和识别地域和历史俚语来源方面的有效性，同时揭示了大型语言模型在该数据集上的性能和微调的潜力。

Apr, 2024

DuanzAI：带有幽默理解提示的俚语增强语言模型

通过DuanzAI方法实现了对汉语俚语的深度理解，以构建与人类表达更加贴合的回应，并发布了先进的聊天机器人ChatDAI的代码。

May, 2024