使用非各向同性距离和组合改进追踪链推荐
研究了JIRA中连接问题的各种类型链接,将其分为五类,并发现了不同类型链接的特点和趋势,最后运用现有的深度学习方法,发现这种方法在识别重复链接时存在问题,并提出了解决方法。
Apr, 2022
本文提出了一种新的代码推荐框架CODER,通过建立异构图并对文件结构进行聚合,实现了微观用户-代码交互和宏观用户-项目交互的联合建模,进而预测开源软件开发者的未来贡献行为。该框架在多种实验设置下(包括项目内、跨项目和冷启动推荐)都取得了优异的性能表现,作者还构建了三个大规模的数据集,以促进未来的研究方向。
Oct, 2022
比较语义文本相似性方法在检索类似缺陷报告方面的有效性,使用TF-IDF(基线)、FastText、Gensim、BERT和ADA等嵌入模型来评估性能。研究结果表明,BERT一般在召回率方面表现优于其他模型,其次是ADA、Gensim、FastText和TFIDF,对检索类似缺陷报告任务选择合适的嵌入方法的影响进行了探讨。
Aug, 2023
使用Java动态分析工具记录核心Java库的调用,对应用程序跟踪进行预训练,通过STraceBERT模型有效地检索方法源代码,为软件逆向工程的代码检索问题提供了有希望的解决方案。
Dec, 2023
我们在这篇论文中对知识图谱完成方法的标准评估协议进行了全面的分析,发现了采用随机抽样评估链接预测或建议方法的严重局限性,并提出了一种使用关系推荐器指导评估候选对象选择的框架,通过有效的预处理和抽样方法,可以在大大减少计算时间的同时,可靠地预测整个排序过程的实际性能。
Jan, 2024
我们提出了一种新的方法来自动化将高级业务需求与更高级的技术系统需求关联起来,该方法使用词袋模型和TF-IDF得分函数表示每个需求,并使用最近的词嵌入表达方式改进余弦相似度函数以提高效率。实验证明,与现有方法相比,我们的方法在某个数据集中的F2分数增加了约18.4%。
Jun, 2024