Apr, 2024

Sõnajaht: 定义嵌入和语义搜索用于反向词典创建

TL;DR提出了一种基于信息检索的反向字典系统,使用现代预训练语言模型和近似最近邻搜索算法,应用于现有的爱沙尼亚语词汇资源,目的是通过引入语义搜索来增强和丰富该资源,并提供跨语言的反向字典功能。评估结果表明,在单语言设置下,该基于信息检索的语义搜索方法是可行的,其在跨语言设置下通过使用无标签评估方法产生了中位排名为 2 的结果,其中包括以爱沙尼亚语为训练数据的模型在特定任务中表现出更好的性能。