关键词document representations
搜索结果 - 5
- 文本分类的双曲质心计算
介绍了超几何词嵌入在 NLP 中的新发展,与欧几里得嵌入不同,它们是在超几何空间中表示为点而非向量,因此需使用超几何质心方案来构建文档表征并进行文本分类。
- 使用深度查询交互学习多样的文档表示进行密集检索
提出了一种新的密集检索模型,使用深度查询交互学习多样的文档表示,通过生成的伪查询对每个文档进行编码,以获得查询信息和多视角的文档表示,不仅具有类似于原始双编码器模型的高推理效率,还可以在文档编码中实现深入的查询 - 文档交互并提供多方面的表 - SciEv:科学新闻查找科学证据论文
SciEv 是一个系统,可以在给定科学新闻文章的情况下搜索科学证据论文,并采用两阶段查询范式以检索候选论文并进行重新排序,它使用领域知识实体来找到候选论文,证明比常规关键短语更有效,并在重排阶段中探索了新闻文章和候选论文的不同文档表示方法。
- X-Class: 极弱监督文本分类
本文提出一种基于弱监督模型下的文本分类方法,利用表面类名进行自适应表示学习,通过一个新的框架 X-Class,通过计算类别间相似性和类别特征相似度,完成文档表示和分类,实验表明该方法在多个基准数据集上表现良好。
- 使用多过滤器残差卷积神经网络从临床文本进行 ICD 编码
本文提出一种基于多滤波残差卷积神经网络的自动 ICD 编码方法,该方法使用多滤波卷积层和残差卷积层以学习变长文本片段之间的上下文关系,并在 MIMIC 数据集上获得了高于现有模型的表现。