BriefGPT.xyz
大模型
Ask
alpha
关键词
prompting strategies
搜索结果 - 22
零样本分类中的提示复杂度导航:计算社会科学中大型语言模型的研究
在计算社会科学分类任务中,评估了 ChatGPT 和 OpenAssistant 两种公共可访问的 LLM 的零次效果,并研究了各种提示策略的影响。发现在零次设置下,当前 LLMs 无法与较小的经过微调的基线变压器模型(如 BERT)的性能
→
PDF
a year ago
ChatGPT 是否具备心理理论?
本文研究了最近在 ChatGPT 传统中的大型语言模型是否具有人的思维和决策能力,通过六个著名的心思想问题的测试,结果发现 ChatGPT-4 相对于 ChatGPT-3 正确率更高,尽管具有错误估计或无效推理等不足之处。
PDF
a year ago
Prev
Next