BriefGPT.xyz
Ask
alpha
关键词
semantic indexing
搜索结果 - 5
使用标签自编码器改进大规模 k 近邻文本分类
本研究提出了一种多标签懒惰学习方法,以解决在存在高互相关联的复杂结构标签词汇的大型文档集合中的自动语义索引问题。该方法是传统 k 最近邻算法的演化,它使用经过训练的大型自编码器将大标签空间映射到较小的潜空间,并从该潜空间重新生成预测的标签。
→
PDF
5 months ago
语言模型作为语义索引器
本文介绍了 LMINDEXER,一种自我监督框架,用于学习语义标识符,该方法能够处理顺序离散标识符的挑战,并通过生成性语言模型和自监督文档重构目标进行训练,从而改善了语义监督不足的问题。通过在不同领域的五个数据集上进行实验证明,LMINDE
→
PDF
9 months ago
ICML
SpotEM: 基于视频的记忆检索的高效搜索
SpotEM 是一种有效的远程视频检索方法,它使用语义索引和剪辑选择器技术减少检索时耗费的时间和计算资源。
PDF
a year ago
基于弱监督深度学习的生物医学文献大规模细粒度语义索引
本研究提出了一种基于深度学习的自动化主题注解细化方法,通过在文章摘要中的概念出现来进行弱监督,发现概念出现是自动化主题注解细化的强有力依据,还可以与基于字典的启发式算法相结合以进一步提高准确率。
PDF
a year ago
PECOS:针对巨大和相关输出空间的预测
我们提出了一个名为 “PEXOS” 的机器学习框架,可在解决预测大型输出空间问题时提高数据密集程度。该框架通过三个阶段,即利用语义索引方案组织输出,通过机器学习匹配方案缩小输出范围,通过最终排名方案对匹配项目进行排名。此框架可根据需要进行配
→
PDF
4 years ago
Prev
Next