BriefGPT.xyz
大模型
Ask
alpha
关键词
numerical questions
搜索结果 - 3
ACL
大规模语言模型的红队攻防:解决数学任务中的幻觉问题
评估不同提示技术对解答质量的影响,通过红组合作将 LLMs 在基础计算和代数任务上进行测试。结果发现,尽管结构化推理和提供解题示例可以减缓解答质量的恶化,但 gpt-3.5-turbo 和 gpt-4 模型在基础计算和推理任务上表现不佳,即
→
PDF
6 months ago
HRoT:表 - 文混合问答中的混合提示策略与思维检索
通过提出混合提示策略和检索思路以进行文本表格问答,我们的方法通过上下文学习和以连贯思路引导模型,在少样本情况下,相对于完全监督的最先进方法,在 MultiHiertt 数据集上实现了卓越的性能。
PDF
9 months ago
利用神经网络预测未来世界事件
该研究介绍了 Autocast 数据集以及伴随的新闻语料库,以提高语言模型的预测能力,其中还包括数字问题和度量标准的 IntervalQA 数据集,并发现语言模型的性能远低于人类专家基准,但随着模型规模和新闻语料库相关信息的增加,性能有所提
→
PDF
2 years ago
Prev
Next