BriefGPT.xyz
Ask
alpha
关键词
massive text embedding benchmark
搜索结果 - 4
文本嵌入的最新进展:MTEB 基准测试中最佳方法的综述
通过对最近大规模文本嵌入基准测试中表现最好的文本嵌入进行详细比较和分析,本文概述了通用文本嵌入模型的最新进展,突出了该领域的关键贡献和局限,并提出了潜在的灵感未来研究方向。
PDF
a month ago
Gecko:从大型语言模型中提取的多功能文本嵌入
我们提出了一种紧凑而多功能的文本嵌入模型 Gecko,其通过利用大语言模型(LLMs)将知识从 LLMs 中提炼到检索器中来实现强大的检索性能。
PDF
3 months ago
8192 个标记双语文本嵌入的多任务对比学习
该研究介绍了一套新颖的双语文本嵌入模型,能够处理长度长达 8192 个标记的文本输入,支持英语和目标语言,适用于文本检索、聚类和语义文本相似性计算等自然语言处理任务。通过专注于双语模型和引入独特的多任务学习目标,研究提高了 STS 任务模型
→
PDF
4 months ago
MTEB: 大规模文本嵌入基准测试
本文介绍了 Massive Text Embedding Benchmark 评估了 33 种模型在 8 种嵌入任务和 112 种语言上的表现。结果发现,没有一种嵌入方法能够完全在所有任务上占优势,因此需要进一步研究和发展通用的文本嵌入方法
→
PDF
2 years ago
Prev
Next