BriefGPT.xyz
大模型
Ask
alpha
关键词
text representation learning
搜索结果 - 4
驻足于起始处:语言模型如何嵌入长篇文档以进行稠密检索
这项研究调查了 Transformer-based 模型在文本表征学习中的位置偏差存在情况,特别是在网络文档检索的背景下。我们基于先前研究的基础上,拓展了关于因果性语言模型输入序列中信息丢失的问题,将其应用于表征学习领域。我们在编码器 -
→
PDF
3 months ago
KeyGen2Vec: 通过多标签关键词生成在问答中学习文档嵌入
我们的研究旨在通过使用序列到序列(Seq2Seq)文本生成器学习文档嵌入,以减少对标签监督的依赖,并将关键短语生成任务重新形式化为基于社区的问答(cQA)中的多标签关键词生成。实证结果显示,相对于多标签关键词分类器,KeyGen2Vec 在
→
PDF
8 months ago
在文本丰富的网络上使用一个文本编码器学习多重嵌入
在多重文本丰富网络中,通过使用 METERN 框架进行学习,能有效地捕捉网络中的多重结构,并保持参数效率。
PDF
9 months ago
ACL
重参数化技巧如何破坏不同 ially-Private 文本表示学习
该研究简要分析了使用 DPText 进行文本表示学习的几篇最近的自然语言处理论文,并揭示了它们虚假的差分隐私声明。此外,还提供了一个简单而通用的经验检查来确定给定的实现是否违反了隐私损失保证,以引起人们对将差分隐私应用于文本表示学习的潜在陷
→
PDF
2 years ago
Prev
Next