Nov, 2023
ML-Bench:大型语言模型基于开源库进行机器学习任务
ML-Bench: Large Language Models Leverage Open-source Libraries for Machine Learning Tasks
Yuliang Liu, Xiangru Tang, Zefan Cai, Junjie Lu, Yichi Zhang...
TL;DR通过使用开源库完成机器学习任务,本文旨在提出一种新的评估设置,以评估大型语言模型(LLMs)在实际编程中的适用性,并介绍了 ML-Bench 和 ML-Agent 两个工具,用于评估 LLMs 在利用开源函数时的有效性。