Jun, 2024

揭示大型语言模型中的细粒度值和观点

TL;DR通过分析大量的语言模型响应,我们发现大量语言模型的回应以及它们的正当性存在偏见和不一致性,此外,通过对回应的分析还发现了在不同情境下产生相似正当性的模式。