Jan, 2018

使用随机森林的连体神经网络检测重复问题对

TL;DR使用门控循环单元(GRU)与其他高度使用的机器学习算法(如随机森林、Adaboost和SVM)结合,对Quora发布的一个包含约400k对标记问题的数据集进行相似性预测任务,其中最好的结果是使用双向GRU的Siamese修改,并用随机森林分类器,这让我们在Kaggle上的Quora问题对比赛中进入了前24%。