Nov, 2024

通过语义嵌入和对比学习分离作者身份与内容

TL;DR该研究针对作者身份与内容间的纠缠问题,通过创新的方法减少内容泄漏对作者身份识别的影响。作者提出了一种结合对比学习与语义相似性模型生成的硬负样本的技术,从而实现内容嵌入和风格嵌入空间的分离,显著提高了作者身份识别的准确性,尤其在挑战性评估中提升了多达10%的准确率。