BriefGPT.xyz
大模型
Ask
alpha
关键词
model limitations
搜索结果 - 5
构建科学研究中生成型人工智能的道德准则
发展分析和缓解策略,提供了一个初始框架来理解模型限制、尊重隐私、保密和版权、避免抄袭和政策违规、确保应用程序提供整体利益,并透明可重现地使用人工智能,以保护研究的完整性。
PDF
4 months ago
利用方差特征归因识别预测不确定性的驱动因素
解释性和不确定性量化是可信赖人工智能的两个基石,本研究提出了一种简单可扩展的方案来解释预测的不确定性,通过使神经网络配备带有高斯输出分布的方差输出神经元来预测方差,然后利用现成的解释器解释模型的不确定性估计。
PDF
5 months ago
ACL
Curriculum: 自然语言理解广覆盖语言现象基准测试
本文介绍一种新的 NLI 基准 Curriculum,其中包括 36 种广泛涵盖的语言现象的数据集和评估程序,证明这种以语言现象驱动的基准在诊断模型行为和验证模型学习质量方面具有有效性,同时为未来对数据集的重新设计、模型架构和学习目标的研究
→
PDF
2 years ago
对基于代码训练的大型语言模型的评估
本文介绍了从 GitHub 公开可用的代码细调的 Codex 语言模型,并研究了其 Python 代码编写能力。在新的评估集 HumanEval 上,我们的模型可解决 28.8% 的问题,并发现重复采样模型是解决难题的有效策略。但我们也发现
→
PDF
3 years ago
ACL
通过自然语言交互纠正语义解析错误
该研究通过 NL-EDIT 模型演示自然语言反馈的交互过程中,对语义解析的一次修正可以将现有文本到 SQL 解析器的准确性提高 20%,并分析该模型的局限性并讨论改进和评估方向。
PDF
3 years ago
Prev
Next