- Rosetta Stone 在 KSAA-RD 共享任务中的应用:从语言建模到词定义对齐
以阿拉伯逆向词典为例,通过阿拉伯文或英文定义为输入,使用模型预测词嵌入并通过取平均值得到最终的表示,另外将英文定义翻译为阿拉伯文并应用于模型也是有效的解决方法。
- 利用对抗性对比训练提高推文健康提及分类
该论文利用对抗性训练和对比损失提高了医疗提及分类的性能,并通过解释性人工智能对结果进行分析。
- 从传统到最先进的单词表示语言模型:全面调查
本文综述了自然语言处理中的单词表示模型,介绍了从传统到现代的语言模型,包括各种文本表示方法,并讨论了这些模型在机器学习算法中的应用,以及在不同 NLP 任务中使用这些单词表示的应用。
- MM越南多项选择阅读理解的深度神经网络模型实验研究
本文介绍了利用多个神经网络模型对低资源语言(越南语)中的多项选择机器阅读理解的影响进行的实验,其中使用了六种不同的越南语单词嵌入和 BERT 模型,在 ViMMRC 语料库上的测试集中,BERT 模型的准确率为 61.28%。
- AAAI使用随机噪声做遮罩改进词汇表示方法
GROVER 是一种用于词语表示和性能提升的训练方法,通过渐进式地将随机噪声添加到词嵌入中,得到进一步优化和专门化于任务的词表示,并在文本分类数据集上实验得到更好的模型性能。
- 视觉语言模型中的单词识别、竞争和激活
本文研究了如何在视觉语音循环神经网络中表示和识别单词,使用门控方法分析神经网络所学单词表征的正确性和词汇竞争过程中的单词激活方式,其结果表明当网络能接触到目标单词第一个音素时才能正确识别单词表征。
- IJCAI序列标注中新词的任务特定表示学习
本研究提出了一种基于表面形式和上下文预测不能识别的单词的表示方法,解决了基于神经网络的序列标记系统中的词汇外问题(OOV problem),实验结果显示该方法在对比现有最先进的方法时表现更好。
- WWW文本表示学习的语义希尔伯特空间
通过在单个语义希尔伯特空间中对语义单元进行建模,本文提出了一种新框架,用于文本分类任务,并在六个基准文本分类数据集上展示了该模型的有效性、鲁棒性和自我解释能力。
- ICLR多语言词嵌入的无监督超级对齐
本文研究了将在多种语言中学习到的连续单词表示对齐到一个共同空间的问题,并提出了一种新的方案来保证映射的组合性,从而在维持直接单词翻译的竞争性表现的同时,实现了间接单词翻译的更好对齐。
- ACL深度生成模型用于联合对齐和词表示
使用翻译数据作为词表示模型的语义相关学习信号的源,利用翻译中的等价性作为分布式上下文进行联合嵌入和对齐,通过概率归一化的隐变量词汇对齐实现嵌入词,并比较上下文中的词的重叠度。应用于多个语义任务上获得了良好的性能表现。
- 在线学习计算词向量
本文提出一种从少量辅助数据中即时预测稀有词嵌入的方法,并在阅读理解、文本蕴含和语言建模等任务中,与仅在任务端训练的嵌入相比,展现了更好的结果。
- ICCVAttributes2Classname:一种基于属性的判别式无监督零样本学习模型
本论文提出了一种基于名称的无监督零样本学习方法,通过区别性地学习单词表示,使得类别和属性名称的相似性与视觉相似性相符,突破了传统零样本学习方法依赖属性特征标注的限制,并且能够在纯文本数据上进行训练,实验结果表明该方法在三个基准数据集上取得了 - 融合场景文本与视觉外观进行细粒度图像分类
本文提出了一种利用场景文本进行图像理解的方法,通过符号识别系统获取识别的单词和深层视觉特征的嵌入组合成一个可通过卷积神经网络进行优化的单一表示形式。通过引入注意力机制强化符号与图像之间的关系,不仅有效地提高分类准确率,而且可较大幅度提升产品 - 神经机器翻译中适用于形态丰富语言的词表示模型
本文提出了使用字符和形态级别单词分解学习单词表示的若干结构,并将这些表示法纳入一种新颖的机器翻译模型中,通过一个硬注意力机制联合学习单词对齐和翻译,从而提高 morphologically rich languages 翻译成英语的机器翻译 - ACL基于贝叶斯优化的课程学习:任务特定词表示学习
使用贝叶斯优化方法学习课程,优化基于特征表示学习的下游任务的性能。采用线性排序功能建模课程,通过学习权重向量和特征向量的标量积来表征训练语料库中每个实例的复杂性不同方面,表明学习课程相比于随机顺序和自然语料库顺序可以提高各种下游任务的性能。
- 在形式中寻找功能:用组合字符模型表示开放词汇
提出了一种使用双向 LSTMs 将字符组合成词向量表示的模型,相对于传统的独立词向量模型,我们的模型仅需要每个字符类型一个向量和一个固定的组成模型参数,使用此模型的 “组合” 单词表示在语言建模和词性标注方面表现出最先进的结果,特别是在形态 - 文本的线性动力学系统模型
该研究通过概率隐变量序列模型,使用前向算法实现连续状态 Kalman 滤波器来学习单词的表示。通过 EM 算法准确地优化参数,使用所学习到的单词嵌入作为标记任务的特征,在标记任务中实现显著的准确度改进,并通过线性递归神经网络通过我们的模型的 - 基于计数模型的词向量表示恢复
该研究是关于使用基于计数的模型来提取文本的语义表征,使用 Hellinger 距离用于处理大型语料库中的单词共现统计数据,并获得了很好的性能表现。
- NIPS使用隐马尔可夫模型进行序列标注的领域自适应
该研究论文介绍了一种基于隐藏马尔科夫模型来学习词汇表示,并使用大量未标记数据将这些方法更好地适用于不同领域数据的方法。