Dec, 2023

高维度中的嵌入向量估计

TL;DR基于一种概率模型,研究了嵌入学习在离散数据中的可学习性,并提出了一种用于估计的低秩近似消息传递方法,探讨了样本数量、词项频率和嵌入相关性对概率分布的影响。通过对合成数据和真实文本数据的模拟验证了理论研究的可行性。