Aug, 2023

编码 - 存储 - 检索:通过语言编码的自我中心感知增强记忆辅助

TL;DR我们提出了一种记忆增强系统,利用自然语言编码和存储视频数据,并借助大型语言模型进行查询,旨在解决生活记录大量数据和高效检索特定信息的挑战。通过使用 QA-Ego4D 数据集评估我们的系统,在 BLEU 分数上取得了 8.3 的最先进结果,优于传统机器学习模型的 3.4 到 5.8 的成绩。在用户研究中,与人工参与者的 2.46/5 的得分相比,我们的系统在现实生活情景记忆任务上获得了更高的平均回应得分 4.13/5。