BriefGPT.xyz
大模型
Ask
alpha
关键词
prompt robustness
搜索结果 - 3
ICLR
RAmBLA:一个评估 LLMs 在生物医学领域作为助手可靠性的框架
我们引入了 RAmBLA 框架,评估了四种最先进的基于语言模型的助手是否能在生物医学领域中作为可靠的助手,并明确了快速性、高召回率和缺乏幻觉是这种使用情况的必要标准。
PDF
3 months ago
PromptBench:评估大型语言模型对对抗性提示的鲁棒性
本研究使用 adversarial prompts 对 Large Language Models 进行度量,并分析了 prompt 鲁棒性及其传递性,为 prompt 组合提供了实用性建议。
PDF
a year ago
使用指令微调语言模型的自动化少样本分类
通过使用指导微调的语言模型,构建了一个用于 few-shot 学习的方法,名为 AuT-Few,该方法可以自动选择适合的任务指令,并实现了较强的 prompt 稳健性和良好的分类性能。
PDF
a year ago
Prev
Next