Mar, 2023
使用风险卡评估语言模型部署
Assessing Language Model Deployment with Risk Cards
Leon Derczynski, Hannah Rose Kirk, Vidhisha Balachandran, Sachin Kumar, Yulia Tsvetkov...
TL;DRRiskCards 是一种针对语言模型应用的风险评估框架,通过提供清晰的风险路径、在众多风险分类中的美站、以及示例提示 - 输出对,为特定模型或应用场景制定风险和伤害的映射图,最终有助于风险景观的维护和易用性。