Jun, 2024

WellDunn:关于语言模型和大型语言模型在识别健康维度中的稳健性和可解释性

TL;DR语言模型在精神健康应用中的可信度、解释性和一致性的研究表明,现有研究中这些模型的注意力质量及其对真实解释的影响尚未被探究,而本研究提出了一个评估设计,聚焦于在鉴别健康维度方面的 LMs 和 LLMs 在多标签分类和解释性方面的鲁棒性和可解释性,并发现了一些令人惊讶的结果,强调进一步研究这些模型在精神健康领域的一致性和解释性的必要性。