Mar, 2024

无参考摘要的信息论蒸馏

TL;DRInfoSumm 是一种基于信息理论目标的新型框架,通过互信息来蒸馏出一个强大的摘要器,不依赖于大规模语言模型的能力或人工编写的参考文献,参数仅为 568M,性能竞争力强,在人工评估中超过了领域内监督模型,更胜一筹于 ChatGPT 的可控摘要。