EMNLPOct, 2023

透过表示相异性理解语言模型的内部工作机制

TL;DR语言模型的内部工作机制是通过表示相异度测量所评估的,这是一组有潜力的工具,可以增加对语言模型内部工作机制的了解。