该研究提出了一种方法,通过对句子和文档的主题进行深入理解,不仅分析数据中的词频,而且可以检测包括非常见词或新词在内的潜在主题,还使用了基于语义空间的异类词和相似性度量等新的评价指标,并通过与人工识别相似性度量的相关系数,在文本挖掘方面展现出优秀的性能结果。
Mar, 2023
使用模糊和非正式的专家知识指导文本中解释性潜在主题的发现,结合了信息瓶颈和总相关性解释方法,对 Anchored CorEx 进行了初步评估,并在两个不同的语料库上产生了更连贯和可解释的主题。
Jun, 2016
通过提取结构化知识,我们提出了一种端到端的联合学习框架,旨在解决基于嵌入的推荐模型缺乏可解释性和受到数据稀疏性的困境。实验证明,该框架能够实现最先进的推荐效果,并且能够提供可解释的推荐原因。
Dec, 2019
本文提出了一种新颖的基于层次贝叶斯模型的社交网络信息效果预测方法,并结合主题建模和概率矩阵分解,从训练数据中自动推断有用的潜在主题和社交信息以及其对协作过滤的重要性,并展现了该算法在推荐系统方面优于现有方法的实验结果,揭示了社交圈在信息的决策过程中比个人品味更具影响力,以及可能在许多利用社交信息的推荐系统中存在的信息泄露问题的解决方案。
Jun, 2012
为了提高用户满意度和建立信任,推荐系统内提供解释尤为重要,特别是对为用户定制的推荐物品进行解释。在这个研究领域中,主要方法是生成基于文本的解释,主要侧重于应用大型语言模型(LLMs)。然而,由于时间限制和计算资源限制,对于可解释性推荐来说,细化 LLMs 的工作并不可行。作为替代方案,当前的方法是训练提示而不是 LLMs。在这项研究中,我们开发了一个模型,利用用户和项目输入的 ID 向量作为 GPT-2 的提示。我们在多任务学习框架内使用联合训练机制来优化推荐任务和解释任务。这种策略能更有效地探索用户的兴趣,提高推荐的效果和用户满意度。通过实验,在 Yelp、TripAdvisor 和 Amazon 数据集上,我们的方法在解释能力评估指标上分别达到 1.59 DIV、0.57 USR 和 0.41 FCR,相比于四种现有技术,表现出卓越性能。此外,我们发现所提出的模型能够确保在这三个公共数据集上文本质量的稳定。
Jan, 2024
通过两个规则,从过去的数据中提取关键和分离的知识,以提高参数化知识库的记忆和泛化能力,促进信息的稳定和广义的知识表达。
May, 2024
本研究基于深度神经语言模型,探讨了信息熵在信息提取过程中过拟合的作用,提出了 TIER-A 联合训练框架,使用温度校准和信息熵正则化避免了过拟合,并在广泛的实验中得到了验证。
Nov, 2022
本文提出了两种新颖的模型来进行关键字建议任务,使用 Word2Vec 和 FastText 的架构,通过利用文档中的关键字共现来生成关键字嵌入向量,并采用特殊的负例抽样方法来利用关键字在学术出版物中的出现方式。此外,还提供了基于排名的评估方法,对所提出的模型进行评估,并在已知项目和自由搜索场景下显示了较大的性能改进。
Jan, 2023
利用最大熵的方法,通过求解一组线性方程来处理协同过滤中稀疏的训练数据和条件概率的计算问题。
Jul, 2012
本研究旨在开发一种多任务学习解决方案,通过联合张量分解整合用户偏好模型和文本解释模型来解释自动生成的推荐,从而提高用户的满意度,并且得到了两个大型 Amazon 和 Yelp 评论数据集的证实。
Jun, 2018