inherent biases | BriefGPT - AI 论文速递

关键词inherent biases

搜索结果 - 4

COLING优秀但不足的：大型语言模型中的国籍偏见 - ChatGPT 的案例研究
ChatGPT（GPT-3.5）是一个大型语言模型，该研究调查了 ChatGPT 中的国籍偏见，通过分析自动生成的论述，发现其生成的文本表现出真实世界中的国籍偏见，强调了对大型语言模型中潜在偏见的进一步审查的必要性。
PDF2 months ago
航向偏见之海：通过因果结构对语言模型进行政治偏见归因
以 ChatGPT 为例，本研究探讨了大型语言模型（LLMs）在感知和解释复杂社会政治环境方面的能力，特别在政治辩论中进行了上下文分析，旨在揭示 LLMs 在解释和裁决 “好论点” 时其决策过程和内在偏见。通过应用 Activity Dep
PDF8 months ago
OpinionGPT: 模拟指导调整的 LLMs 中的显式偏见建模
通过 OpinionGPT 演示，我们展示了 OpinionGPT 网页应用，用户可以提问并选择他们希望调查的各种偏见。通过对代表不同偏见的文本进行 fine-tuning，提供模型答案的比较，以增强透明度和显性化地处理偏见。
PDF10 months ago
大型语言模型是否具有人格特质？：自我评估测试在衡量 LLMs 人格方面的适用性
该研究探讨了如何对大型语言模型进行人格测试，并提出了使用自我评估测试的不足之处，主要体现在测试结果不可靠，无法客观准确地测量机器的人格特点，原因是存在内在的偏见和不一致性。因此，需要开发更科学的方法来对大型语言模型的人格特点进行准确可靠的评
PDFa year ago