- 基于需求异味的自然语言需求可测试性衡量
本文提出了一种基于需求异味嗅探和自动生成词典的数学模型,对自然语言需求的可测试性进行评估和排名,并通过经验研究验证了该模型在检测需求异味和测量需求测试性方面的卓越性能。
- 英语和瑞典语中未记录的词义检测
通过使用预训练的上下文词嵌入工具,本文在英语和瑞典语中解决未知意义检测的任务,并通过对现代和历史语料库中的词语用法与语义条目进行比较,证明了模型在少样本情境下能够大幅增加检测到非记录义项的词语用法数目。
- 将字典融入神经网络结构从社交媒体中提取 COVID-19 医疗概念
将字典信息结合神经网络架构用于自然语言处理,从在线医学论坛中提取与 COVID-19 相关的多个概念,并通过监督模型在论坛数据上达到 90% 的宏观 F1 分数,研究表明将小领域字典用于深度学习模型可以改进概念提取任务。
- 语言的媒介
这篇论文介绍了 Goki Muramoto 等人在《Langue 媒体》背后的材料档案,它是一个新的词典和公共雕塑,描绘了语言之间的意义地图,主要通过 “这个词被翻译成那个词” 的事件和两个力量:同一语言中所有词的排斥和不同语言中被翻译的词 - 匹配追踪的快速收敛率
该研究研究了通过字典中的元素的稀疏线性组合逼近目标函数的纯贪心算法 matching pursuit 的基本极限和收敛速率,发现与其他贪心算法变体不同的是,它的收敛速率是次优的,并由特定的非线性方程的解决方案确定,任何收缩量都会在最坏情况下 - 提炼并关注:改进神经机器翻译中的实体翻译
提出了一个提取和关注的方法来增强 NMT 中的实体翻译,方法是先从字典中提取源实体的翻译候选项,然后添加为解码器输入的前缀,以便通过自我注意力机制生成目标语句。实验证明,该方法有效地提高了实体翻译和整体翻译质量。
- 超越 “男性密码”:NLP 背景下的隐性男性偏见
研究调查了两个自然语言处理数据集,发现当语言具有性别特征时,特别是具有男性特征时,就会出现性别偏见,为此提出了一个名为 AVA 的新词典,旨在涵盖性别化语言与 VA 语言之间的模糊关联。
- 自然语言机器人编程:将自然语言处理与自主机器人抓取集成
本文提出了一种基于语法的自然语言机器人编程框架,特别用于拾取和放置任务,其方法使用自定义的动作词词典来存储共享意义的单词,通过增加更多的动作词从词汇数据库,轻松扩展词汇量。本文通过模拟和现实世界的实验验证了我们的自然语言机器人编程(NLRP - EMNLP从词典学习:异构知识引导的中文拼写修正微调
本文提出了一种 LEAD 框架,该框架允许 CSC 模型从字典的语音、视觉和含义方面学习异构知识,并通过基于对比学习的训练方案来提高 CSC 模型的表示能力。实验证明该方法有效。
- MM自由群的类词商
通过构建单词 anagrams,我们基于 26 个生成元的自由群的商确定了其结构,并发现了一个简单的算法通过 301 个可能的 325 个生成元对的 commutators 来确定该群的结构,这些 commutators 由任意字典确定,我 - ACL通过词典自动构建义原知识库
本文提出了一种基于现有词典完全自动地构建英文和法语语义知识库 (SKBs) 的简单方法,并进行了综合评估。实验结果表明,自动构建的英语 SKB 甚至优于需要数十年手动构建的 HowNet,在多个后续任务中,英语和法语 SKBs 都能带来明显 - EMNLPCOVID-19 和 SARS-CoV-2 的全面词典和术语变异分析
本文提出了一个用于识别 SARS-CoV-2 和 COVID-19 相关术语的词汇表,并使用基于规则的方法生成新的术语变体进行分析研究,结果表明尽管已经有标准化术语,但科学文献中用来指代这两种病毒的术语数量庞大并且还在快速增长,进一步证明了 - 面向语言学习者的跨语言定义生成
本文提出一种基于预训练语言模型的简单有效的方法,用于学习英文单词在各种语言中的定义,并在新构建的数据集上进行了实验和手动分析,结果表明,我们的模型具有良好的跨语言转移能力,可以为汉语单词产生流畅的英文定义,而且生成的定义比参考文献中的定义简 - 稀疏编码用于 Alpha 遮罩技术
本研究提出了一种基于稀疏编码、非参数概率分割和字典学习的无配对前景背景样本的 alpha 合成方法,可以从多个前景和背景样本中更准确地估计 alpha 值,同时在视频 matting 中也表现出较好的性能。
- ICON 2015 上面向混合语印度社交媒体文本的词性标注
本文描述我们在 Jadavpur 大学参加 ICON 2015 任务 - 对混合码印度社交媒体文本进行 POS 标注的实验,并开发了一种基于三元隐马尔可夫模型的工具,该模型利用字典以及其他一些单词级别的特征来增强已知和未知代币的观察概率。 - 使用短步长复制卷积核,实现较少独立卷积核的稀疏重建
本文研究了使用改进的 LCA 算法的一种 DCN 类型,探讨了卷积核数量、步长、感受野大小对重建质量的影响,发现使用八个卷积核和步长为 2 的情况下可以产生与 512 个卷积核、步长为 16 的情况下相当的稀疏重建质量,此外发现在给定的步长