Nov, 2022

DS-1000:数据科学代码生成的自然可靠基准

TL;DRDS-1000 是一个包含 1000 个数据科学问题的代码生成基准测试,主要关注多样性、可靠性和防止记忆化,并使用多标准指标进行自动评估。