Sep, 2024

提议、评估、搜索:利用大语言模型实现教学视频中的目标导向规划

TL;DR本研究解决了在教学视频中进行目标导向规划所面临的挑战,尤其是因数据集偏差和缺乏泛化能力导致的问题。通过引入VidAssist框架,利用大语言模型作为知识库和评估工具,进行零样本和少样本的计划生成与评估,显著提升了在不同任务设置下的性能,尤其在VPA和PP任务上超过了当前最先进的方法。