Sep, 2024
MemSim:用于评估基于LLM的个人助理记忆能力的贝叶斯模拟器
MemSim: A Bayesian Simulator for Evaluating Memory of LLM-based Personal
Assistants
TL;DR本研究解决了当前缺乏对基于LLM的个人助理记忆能力进行客观自动评估的问题。通过提出MemSim,这一创新的贝叶斯模拟器能够自动构建用户消息生成的可靠问答,显著提升评估数据集的多样性和可扩展性。研究表明,MemSim不仅可以生成日常生活场景的数据集MemDaily,还为不同记忆机制的评估提供了基准,具有重要的影响力。