BriefGPT.xyz
大模型
Ask
alpha
关键词
evaluation guidelines
搜索结果 - 3
人工评估指南中对漏洞的定义和检测:实现可靠的自然语言生成评估的初步研究
通过收集从现有论文中提取的指南注释以及由大型语言模型(LLMs)生成的指南注释,我们提出了第一个人工评估指南数据集,并引入了八种漏洞的分类和组成评估指南的原则。此外,我们还探索了使用 LLMs 检测指南漏洞的方法,并提供了一套增强人工评估可
→
PDF
22 days ago
抗体发现与开发中的机器学习最佳实践
过去 40 年来,治疗抗体的发现和开发已经变得司空见惯。然而,随着治疗抗体构造变得更复杂(例如多样性抗体),常规的优化方法日益低效。机器学习承诺开辟一条使用较少实验和成本的计算模拟路径来加速药物产品的发现和开发。本文对当前的做法进行了批判性
→
PDF
7 months ago
重新审视可转移对抗图像示例:攻击分类、评估准则和新见解
通过建立新的评估准则,我们在 ImageNet 上对 23 种典型攻击与 9 种代表性防御进行了首次大规模的可传递对抗样本评估,发现既有的评估存在误导性结论和遗漏点,从而阻碍了该领域的实际进展评估。
PDF
9 months ago
Prev
Next