Dec, 2023

对物理 GRE 上 LLM 性能的测试:一些观察

TL;DR最近,大型语言模型(LLMs)的发展及其通过开源模型和 / 或低成本 API 的广泛可用性导致了许多在 K-12 和大学生的 STEM 教育技术领域出现的令人兴奋的产品和应用。本文简要总结和分析了谷歌提供的一种基于 LLM 的流行会话服务 Bard 在标准化物理 GRE 考试上的性能。