Nov, 2023

ML-Bench:大型语言模型基于开源库进行机器学习任务

TL;DR通过使用开源库完成机器学习任务,本文旨在提出一种新的评估设置,以评估大型语言模型(LLMs)在实际编程中的适用性,并介绍了ML-Bench和ML-Agent两个工具,用于评估LLMs在利用开源函数时的有效性。