Mar, 2024

安全可靠的 LLM 检测器:实施、应用和局限性

TL;DR为了应对大规模语言模型的各种风险以及提供有效的人工智能治理,我们致力于创建和应用一套迅速、可靠的检测器模型,旨在识别各种有害输出,并探讨了其发展中的挑战和未来工作。