Mar, 2024

AraTrust: 评估阿拉伯语 LLM 的可信度

TL;DR提出了第一个全面的阿拉伯语语言模型信任度基准 ——AraTrust,其中包含了多个方面的真实性、伦理、安全性、身体健康、心理健康、不公正、非法活动、隐私和冒犯性语言的 516 道人工多项选择题。通过引入 AraTrust,旨在促进共同努力,为阿拉伯用户创造更安全、更值得信赖的语言模型,其中 GPT-4 在阿拉伯语方面表现出最高的可信度。