Sep, 2024

自适应问题回答:基于上下文的多臂老虎机在大语言模型社会中的应用

TL;DR本研究解决了在问题回答中不同类型问题需要不同回答策略的难题,提出了一种动态选择最合适的问题回答策略的方法。通过将自适应问题回答建模为上下文多臂老虎机问题,并利用多个大语言模型的协作,实验表明该方法能够有效提高多模块QA系统的效率与性能。