论文录用排名预测的特征工程和集成建模
本文提出了一个框架来优化论文-审稿人分配,使用适宜性评分来测量论文和审稿人之间的成对亲和力,可以从提供的少量评分中推断出适宜性评分,将任务定义为整数规划问题,并提出了几种适用于论文和审稿人匹配问题的方案,探讨了学习和匹配相互作用的因素,对两个会议数据集进行了实验,测试了几种学习方法的性能以及匹配方法的有效性。
Feb, 2012
研究了用未来学术会议中接受的论文数量作为评价指标,通过分析数据集,使用梯度提升决策树模型等方法,提高评价机构水平的有效方法。
Sep, 2016
该研究提出一种基于数据挖掘技术的解决方案用于排名研究机构,通过利用公共网络信息,预测在即将到来的顶级会议上将有多少研究论文可能被接受。该方案使用了两个步骤的方法:首先识别感兴趣会议的全部研究论文,然后使用两个指数平滑模型进行预测。该文章的解决方案总得分为0.7508,而获胜选手总得分为0.7656。
Oct, 2016
FEED是一种有效的知识蒸馏(knowledge distillation)方法,旨在通过特征映射级别的集成学习,将多个教师网络的知识传递给学生网络,提高其泛化能力,同时在测试时不引入额外的参数或计算。
Sep, 2019
我们提出了一种基于公共主题模型的自动匹配论文与审稿人的方法,该方法可以缓解传统自动匹配方法中的词汇错配和主题重叠等问题,并通过实验验证比现有的方法更有效。
Sep, 2019
本文提出了一种称为多方面因子模型的新方法来改善社交网络中的推荐准确性,该方法将用户之间的社交关系、标签、档案等特征整合在一起,并采用隐性反馈,同时还利用用户行为模型来进行联合预测,并在 KDD-Cup 竞赛中获得了第二名的好成绩。
May, 2021
本文提出了一种新的评估方法,使用合成数据集评估特征重要性得分,并构建了一个名为fseval的Python基准测试框架,该框架允许在HPC系统上并行和分布式地执行实验。通过与在线平台Weights and Biases集成,可以在实时仪表板上交互地探索图表。研究结论通过探索一种大规模实验来找出参与算法的优点和缺点。
Jul, 2022
通过线性独立性分析研究集成大小和分类准确度之间的关系,提出了基于该关系的集成大小的方法。实证结果表明增加分类器数量提高准确度,但存在收益递减点。该研究为进一步研究集成设计的复杂动态提供了开拓途径,并为实际场景中构建高效有效的集成提供了指导。
Aug, 2023
通过引入一种公理化博弈论的方法,本文针对排名任务的特征归因方法提出了Rank-SHAP算法,并通过多方案的计算效率和准确性评估以及与人类直观的一项用户研究,对算法进行了验证和分析。
May, 2024
本研究针对2023年国际机器学习会议(ICML)审稿过程中,利用作者对自己论文的排名来改进评审流程。我们提出了同调机制,证明通过作者排名校准的评分在估计论文的真实期望评分方面优于原始评分,具有显著的改进潜力,并提出了低风险的应用建议以辅助同行评审。
Aug, 2024