BriefGPT.xyz
Ask
alpha
关键词
document-level representations
搜索结果 - 3
ACL
最佳多语言文件嵌入是否只是基于句子嵌入?
本研究系统地比较了使用 LASER、LaBSE 和 Sentence BERT 预训练的多语言模型从句子中生成文档级表示的方法,证明了对于多语言任务来说,通常使用句子嵌入的巧妙组合要优于将整个文档编码为单个单元,并且说明了虽然简单的句子平均
→
PDF
a year ago
层次化文档编码器用于平行语料库挖掘
本研究利用多语言文本嵌入来对平行数据进行最近邻挖掘,通过三种不同的文本层级表示方法,发现用 HiDE 训练产生的文档嵌入结果表现最佳,达到了 UN 平行文档挖掘的最新成果。
PDF
5 years ago
深度学习中文本数据的向量表示
本文研究了稠密分布式文本数据表示的两种新型神经模型:一种用于学习文档级表示,另一种用于学习词级表示。我们提出的模型分别在信息检索和语义关系识别等任务中优于现有方法,并且直接从原始文本数据中学习嵌入。其中,词级表示模型不同于以往的模型,可以用
→
PDF
5 years ago
Prev
Next