BriefGPT.xyz
大模型
Ask
alpha
关键词
comprehensiveness
搜索结果 - 3
Goodhart 定律在 NLP 的解释基准中适用
对于基于显著性的解释方法的研究,存在关于其目的、有效性和相互抵触性的疑虑。本文针对自然语言处理进行了关于评估指标的批判性研究,对两套指标进行了评估,并展示了目前的指标能否准确引导可解释性研究的能力存在疑问,强调有必要对这些指标所要捕捉的内容
→
PDF
10 months ago
ACL
对长篇问答评估的关键评估
对长篇答案进行有针对性的评估研究,强调评估多维度因素,发现自动文本生成的评价指标不能预测人类喜好,建议未来的评估中,应该注重准确性、完整性和客观性等多个方面。
PDF
a year ago
使用深度变分信息瓶颈方法解释黑盒
本研究提出了一种系统无关的解释模式,即采用信息瓶颈原理作为准则来寻找在简洁性和全面性方面都具备的关键特征,并在三个数据集上评估了其可解释性和保真度。
PDF
5 years ago
Prev
Next