BriefGPT.xyz
Ask
alpha
关键词
qa performance
搜索结果 - 3
WSDM
大型语言模型中的时间盲点
该研究旨在调查通用型大型语言模型在需要时间理解的任务中面临的潜在限制,针对三个流行的时间问答数据集,我们发现大型语言模型在关于过去和新信息的详细问题上表现较差,存在多个时间错误,我们的分析有助于理解大型语言模型的局限性,并为开发更好满足时间
→
PDF
5 months ago
利用生成 NQ 类问题来改进问答
本研究提出一种算法,利用数据集转换技术从长的 Trivia 问题转化为类似于日常人类交流的较短问题的方式,自动生成自然问题(NQ)数据集中的问题,同时使用神经分类器检测并去除不合法的问题,从而生成高质量的数据集,提高了 QA 表现,该算法在
→
PDF
2 years ago
ACL
领域自适应问答的合成问题价值评估
本文提出了一种新颖的问题价值估计器(QVE),它可以直接估计合成问题对于提高目标领域问答(QA)性能的有用性。通过综合实验,我们发现 QVE 选择的合成问题可以帮助实现比现有技术更好的目标领域 QA 表现,并且通过使用这些问题并仅使用目标领
→
PDF
2 years ago
Prev
Next