Apr, 2024

无法说不行?大型语言模型中暗黑行话的测量与推理

TL;DR大型语言模型对黑暗术语和领域特定语言的理解以及其对灵敏话题的处理方法的影响进行了研究,并发现模型存在对过滤器的绕过问题和对话题的不同反应。