BriefGPT.xyz
Ask
alpha
关键词
exam
搜索结果 - 3
ICML
使用任务特定的考试生成自动评估检索增强的语言模型
我们提出了一种新的方法来衡量检索增强的大型语言模型(RAG)的任务特定准确性。通过对与任务相关的文档语料库基于多项选择问题评分的自动生成合成考试来进行评估。我们的方法是自动化、成本高效、可解释和稳健的选择 RAG 系统的最佳组件的策略。我们
→
PDF
a month ago
ChatGPT 能否通过越南高中毕业考试?
研究探讨了聊天机器人在教育中的潜力,使用大型自然语言模型 ChatGPT 进行了越南高中毕业考试的实验,并展示了模型在文学、数学、英语、物理、化学、生物、历史、地理和公民教育等多个科目上的良好表现,表明人工智能工具在教育领域中的应用前景广阔
→
PDF
a year ago
评估大型语言模型在高度专业化主题放射肿瘤物理学上的应用
本研究研究使用 LLMS 答题的能力。我们开发了一个包含 100 个肿瘤放射物理学问题的考试,将四个 LLM(ChatGPT(GPT-3.5),ChatGPT(GPT-4),巴德(LaMDA)和 BLOOMZ)与医学物理学家和非专业人员进行
→
PDF
a year ago
Prev
Next