Jan, 2024

基于零样本学习的机器教学构建模块化智能代理

TL;DR利用大型语言模型作为零射击学习器的模块化人工智能代理的鲁棒性和性能可以通过迭代式机器教学方法提升,该方法通过有限的人类反馈在时间上训练人工智能代理,从而解决零射击学习的质量限制,并利用初始部署的数据和零射击学习器的输出或注解来训练更小且任务特定的替代模型,从而降低经济成本和环境影响。在三个与对话式人工智能代理相关的任务上的结果表明,在任务的复杂性和零射击学习器的性能决定下,仅对数据集的 20-70% 进行监督就可以实现接近理想结果的性能。