本文提出一些生成模型,用于解决英语俚语中三种额外语法字形形成的现象,这些模型表现良好。
Apr, 2018
本研究旨在回答机器学习是否能较好地处理文本中的未知词汇以及哪种上下文对于机器来说更为重要的问题,通过构建一个由两个上下文编码器和一个描述编码器组成的神经模型,本研究证明了在处理非标准英语解释和定义生成时,全局上下文与分布在本地文本中的线索都是对于机器有用的。
Nov, 2018
本文回顾了近年来自然语言处理领域的语言模型的发展,并探讨在研究语言模型中基于句法的研究中存在的问题以及解决方案,旨在为未来语言模型的研究提供一种较为多样化和立体化的研究视角。
Oct, 2021
通过因果关系的镜头来研究语言的演变,我们分析了俚语词和非俚语词的语义变化和频率转移,发现俚语词虽然语义变化较小,但频率转移较大。
Mar, 2022
本研究提出一种基于语义信息的俚语解释方法 (SSI),通过考虑候选解释在语境和语义上的适当性,实现了在英语俚语解释方面的最新技术,同时优雅地在缺乏数据的零样本学习和少样本学习中使用。此外,该方法还成功应用于英语俚语的机器翻译中,为自动化解释和翻译非正式语言打开了机会。
May, 2022
本文使用计算模型通过测试历史性俚语词典词条,探究并表征美国和英国二百年来俚语用法地理变异的规律,并提供了历史文化元素在俚语自然语言处理中的应用的机会。
Oct, 2022
将不同的表示学习模型和知识资源结合起来,研究下游任务对俚语理解的依赖关系。实验表明,预先在社交媒体数据上训练的模型优于仅针对静态词嵌入的字典的影响。我们的错误分析确定了俚语表示学习的核心挑战,包括词汇表外单词、多义词、变异和注释不一致。
Dec, 2022
提出了一个新的基准SLANG,评估语言模型对于理解互联网上新兴语言趋势的能力,并提出了基于因果推断的方法FOCUS,它通过研究语言变化的真实例子来增强语言模型对于新短语和用法模式的理解。实证分析表明,基于因果推断的方法在解释互联网俚语和表情包时,准确性和相关性方面优于传统模型。
Jan, 2024
通过影视字幕构建了一个用于评估俚语处理的数据集,展示了该数据集在俚语检测和识别地域和历史俚语来源方面的有效性,同时揭示了大型语言模型在该数据集上的性能和微调的潜力。
Apr, 2024
通过DuanzAI方法实现了对汉语俚语的深度理解,以构建与人类表达更加贴合的回应,并发布了先进的聊天机器人ChatDAI的代码。
May, 2024