Dec, 2023

分析和分类开发者论坛帖子及其意图

TL;DR通过参考以前的研究和从工业角度学习,我们为技术论坛帖子的意图创建了一个精细的分类法。通过手动标记和分析从在线论坛中提取的帖子数据集,我们理解了帖子构成(代码、错误信息)与其意图之间的关系。此外,我们设计了一个基于预训练的 Transformer 模型来自动预测帖子的意图。我们的意图预测框架的最佳变体,在 Micro F1 得分为 0.589,Top 1-3 准确率为 62.6%至 87.8%,平均 AUC 为 0.787 的情况下,优于最先进的基准方法。我们对论坛帖子的性质和自动分类可能有助于论坛维护者或第三方工具开发者改善技术论坛上帖子的组织和检索。我们在补充材料包中发布了我们的带注释数据集和代码。