本文提出了一种基于模板分区和对特征进行排序的配对学习和推理算法,用于大幅减少 NLP 组件中分类器中的向量点积的计算量和提高其速度,并通过词性标注、命名实体识别和基于转移的依存解析等三项实验验证了其实用性。
May, 2015
本文提出了一种新的主动特征获取方法,使用 Lazy Model 和 Fisher scores 确定特征子集以在测试期间最大程度地提高预测性能同时最小化成本(即特征获取成本达到可接受的精度或预算限制),并在合成和实际数据集上进行了实验来证明其准确性和速度优势。
Jun, 2023
本文介绍了一种基于信息论的动态特征选择方法,通过学习选择策略实现特征效益的高效获取。与现有最先进方法相比,该方法在各种数据集上都提供了一致的收益。
提供了一个新的框架,通过强化学习问题对活动特征获取问题进行建模,并引入了一种更系统完善的特征子集编码机制,该方法使用无序 LSTM-based 的集合编码机制来进行学习,从而在包含有缺失条目的情况下得到了很好的应用,并在活动特征获取方面性能均优于其他基线系统。
Sep, 2017
基于部分结果和功能策略,引入了一种算法来估计整个训练数据库中学习曲线的演变,迭代逼近所需时间的值,独立于学习技术的使用,并且在经过预测级别后,被证明在工作假设方面是正确的,使用户能够根据最终可达到的准确性设定收敛阈值的概念扩展,即使存在扭曲观测也似乎是有效的。我们的目标是评估培训工作量,支持决策制定,以减少在学习过程中对人力和计算资源的需求。该提案在至少三个操作过程中是有意义的,第一个是预测准确性的提升,以衡量达到一定性能水平所需的工作量,第二个是在训练时间内比较系统的效率,以仅完成最适合我们要求的系统的任务,同时准确性的预测也是定制系统的有价值信息,因为我们可以预先估计设置对性能和开发成本的影响。通过生成词性标注器作为示例应用程序,实验结果与我们的预期一致。
Feb, 2024
我们提出了一种深度序列生成学习方法来进行特征选择,该方法通过学习连续嵌入空间,将特征选择决策序列映射为与效用分数相关的嵌入向量,从而解决了传统方法中存在的离散搜索空间和专家特定超参数的问题。
Mar, 2024
本文研究的问题是在给定的训练数据集中寻找预测模型。我们提出了一种迭代过程,用于得到一系列不断改进的模型和对原始输入空间的一系列非线性特征。在有限的 N 次迭代后,非线性特征变成原始空间上 2^N - 次多项式。我们展示了在无限次迭代的极限情况下,导出的非线性特征必须形成一个联想代数:两个特征的乘积等于来自同一特征空间的特征的线性组合。由于每次迭代都包含解决一系列包含所有先前解的凸问题,因此随着每次迭代,模型的似然性逐渐提高,而模型参数空间的维数设置为一个有限的可控制值。
Dec, 2013
提出一种针对无序集合的预测模型,解决了现有方法忽视集合结构和存在的不连续性问题,通过单个特征向量可实现点集的自编码、图像中物体边框的预测以及物体属性集合的预测。
Jun, 2019
本文提出一种名为 SeqFM 的新型基于因子分解机的模型,可以完全考虑动态特征之间的因果依赖关系,通过多视角自注意力模型分别建模静态特征、动态特征和静态动态特征的交互作用,完成时序预测分析任务。在六个大规模数据集上的实验结果表明,SeqFM 在排名、分类和回归任务方面都具有优异的效能和效率。
Nov, 2019
提出了一种基于动态特征选择(DFS)和条件互信息的特征选择方法,该方法使用了一种基于分摊优化的学习方法,并在实验中表现出优于其他特征选择方法的性能。
Jan, 2023