Feb, 2024

构建知识:探索基于聊天的搜索引擎的创造性机制

TL;DR该研究揭示了基于大型语言模型的聊天搜索引擎在选择信息来源时偏好可读性强、结构规范、同时具有较低困惑度的文本,这种文本偏好在Bing聊天和RAG API中一致出现,暗示这种文本偏好是由底层语言模型自发形成的。此外,研究还发现RAG技术引用的网站之间的相似性较传统搜索引擎排名最高的网站之间更为相似。