Apr, 2024

大规模语言模型(LLMs)中的语义歧义分析

TL;DR本研究旨在分析和讨论ChatGPT和Gemini等模型中的语言歧义,关注巴西葡萄牙语中的语义、句法和词汇歧义。通过创建一个包含120个歧义和非歧义句子的语料库,进行分类、解释和消除歧义。结果经过定性分析和基于回答准确性的定量评估,证明了即使是像ChatGPT和Gemini这样先进的模型在回答中也存在错误和不足,解释通常是不一致的。此外,准确性达到了49.58%的峰值,表明有必要进行有监督学习的描述性研究。