Sep, 2023

利用大型语言模型进行零样本音频主题重排序

TL;DR该研究项目探讨了使用视频片段作为信息检索的查询术语,而不是传统的文本查询,以实现更丰富的搜索模式,如图像、说话者、内容、主题和情感。研究重点是通过嵌入表示视频属性以支持大型存档的高速灵活搜索,并通过重新排序方法来缓解由此带来的性能损失。研究结果表明,使用大型语言模型的零样本重新排序方法可以在没有任何任务特定训练数据的情况下实现改进的检索排序。