论文录用排名预测的特征工程和集成建模

Nov, 2016

论文录用排名预测的特征工程和集成建模

Feature Engineering and Ensemble Modeling for Paper Acceptance Rank Prediction

Yujie Qian, Yinpeng Dong, Ye Ma, Hailong Jin, Juanzi Li

TL;DR本研究采用三步特征工程方法，包括基本特征定义、查找类似会议以增强特征集，并使用 PCA 进行降维，提出了三种排名模型和集成方法，并在 KDD Cup 2016 中取得了第二名的综合排名。

Abstract

Measuring research impact and ranking academic achievement are important and challenging problems. Having an objective picture of research institution is particularly valuable for students, parents and funding ag

发现论文，激发创造

优化论文匹配的框架

本文提出了一个框架来优化论文-审稿人分配，使用适宜性评分来测量论文和审稿人之间的成对亲和力，可以从提供的少量评分中推断出适宜性评分，将任务定义为整数规划问题，并提出了几种适用于论文和审稿人匹配问题的方案，探讨了学习和匹配相互作用的因素，对两个会议数据集进行了实验，测试了几种学习方法的性能以及匹配方法的有效性。

Feb, 2012

预测研究机构未来影响力- KDD Cup 2016 获胜解决方案

研究了用未来学术会议中接受的论文数量作为评价指标，通过分析数据集，使用梯度提升决策树模型等方法，提高评价机构水平的有效方法。

Sep, 2016

评估学术机构在即将到来的会议中论文录取潜力

该研究提出一种基于数据挖掘技术的解决方案用于排名研究机构，通过利用公共网络信息，预测在即将到来的顶级会议上将有多少研究论文可能被接受。该方案使用了两个步骤的方法：首先识别感兴趣会议的全部研究论文，然后使用两个指数平滑模型进行预测。该文章的解决方案总得分为0.7508，而获胜选手总得分为0.7656。

Oct, 2016

FEED: 特征级集成的知识蒸馏

FEED是一种有效的知识蒸馏（knowledge distillation）方法，旨在通过特征映射级别的集成学习，将多个教师网络的知识传递给学生网络，提高其泛化能力，同时在测试时不引入额外的参数或计算。

Sep, 2019

PaRe: 使用公共主题空间的论文-审核人匹配方法

我们提出了一种基于公共主题模型的自动匹配论文与审稿人的方法，该方法可以缓解传统自动匹配方法中的词汇错配和主题重叠等问题，并通过实验验证比现有的方法更有效。

Sep, 2019

社交网络推荐预测的多方面分解模型群集

本文提出了一种称为多方面因子模型的新方法来改善社交网络中的推荐准确性，该方法将用户之间的社交关系、标签、档案等特征整合在一起，并采用隐性反馈，同时还利用用户行为模型来进行联合预测，并在 KDD-Cup 竞赛中获得了第二名的好成绩。

May, 2021

监督式特征排名算法的新型评估方法

本文提出了一种新的评估方法，使用合成数据集评估特征重要性得分，并构建了一个名为fseval的Python基准测试框架，该框架允许在HPC系统上并行和分布式地执行实验。通过与在线平台Weights and Biases集成，可以在实时仪表板上交互地探索图表。研究结论通过探索一种大规模实验来找出参与算法的优点和缺点。

Jul, 2022

利用组件分类器的线性独立性：优化在线集成的大小和预测准确性

通过线性独立性分析研究集成大小和分类准确度之间的关系，提出了基于该关系的集成大小的方法。实证结果表明增加分类器数量提高准确度，但存在收益递减点。该研究为进一步研究集成设计的复杂动态提供了开拓途径，并为实际场景中构建高效有效的集成提供了指导。

Aug, 2023

RankSHAP：一种用于排序任务的金标准特征归因方法

通过引入一种公理化博弈论的方法，本文针对排名任务的特征归因方法提出了Rank-SHAP算法，并通过多方案的计算效率和准确性评估以及与人类直观的一项用户研究，对算法进行了验证和分析。

May, 2024

对ICML 2023排名数据的分析：作者对自己论文的看法是否能辅助机器学习领域的同行评审？

本研究针对2023年国际机器学习会议（ICML）审稿过程中，利用作者对自己论文的排名来改进评审流程。我们提出了同调机制，证明通过作者排名校准的评分在估计论文的真实期望评分方面优于原始评分，具有显著的改进潜力，并提出了低风险的应用建议以辅助同行评审。

Aug, 2024