BriefGPT.xyz
大模型
Ask
alpha
关键词
information-seeking tasks
搜索结果 - 2
评估问题回答的指令遵循模型的准确性和忠实性
研究中使用检索辅助的指令跟随模型在信息搜索问答任务中的性能表现,并分析了传统指标的不足之处,提出了反映这些模型真实性能的简单基于词汇重叠和模型的度量标准。研究发现,指令跟随模型在正确性方面具有一定竞争力,甚至有时优于微调模型,但在基于提供的
→
PDF
a year ago
ChatGPT 与 Google:搜索性能和用户体验的比较研究
本研究探讨了使用搜索引擎和聊天机器人工具进行信息寻求任务时用户行为的差异,并表明 ChatGPT 组在所有任务中花费的时间都较少,用户反馈的用户体验显著更好,然而,ChatGPT 还可能会导致过度依赖并产生或复制错误信息。
PDF
a year ago
Prev
Next