- MM基于机器学习的无线定位中最小描述特征选择的复杂度降低
我们设计了一种利用最小描述特征来大大降低深度学习网络复杂性的新型定位神经网络(P-NN)。通过最大功率测量及其时间位置传达进行定位所需的信息,使 P-NN 的学习能力得到改进,同时在稀疏图像和测量矩阵上实现自注意力机制以强化网络的训练能力, - DeepLINK-T:使用 knockoffs 和 LSTM 进行时间序列数据的深度学习推理
提出了一种新的方法 DeepLINK-T,结合深度学习和 Knockoffs 推断,在高维长时序数据中控制假发现率(FDR),实现特征选择。该方法通过使用 LSTM 自编码器生成时间序列的 Knockoff 变量,使用原始和 Knockof - MM可靠的特征选择对抗性鲁棒性网络攻击检测
通过选择与网络攻击检测最相关的特征,在网络流量分析中训练机器学习模型所使用的高质量数据,可以提高模型的鲁棒性和计算效率。通过改进数据集、选择与时间相关的特征和更具体的特征集,以及进行对抗训练,机器学习模型在不损害正常流量传输的情况下显著提高 - 特征选择的快速遗传算法 —— 一种定性近似方法
本文提出了一种两阶段的辅助代理进化方法,用于解决在大型数据集的封装设置中使用遗传算法进行特征选择时产生的计算问题。通过构建轻量级的定性元模型通过主动选择数据实例进行特征选择任务,并在遗传算法 CHC 的基础上应用该过程来创建定性近似变体 C - 机器学习在医疗领域中公平特征选择的评估
在普遍采用机器学习的医疗领域,自动化的社会偏见可能会加剧健康差距,我们探索了从特征选择的角度来解决算法公平性。传统的特征选择方法忽视了不同子群体之间这些因素的差异,而我们的公平特征选择方法考虑了所有人口群体的平等重要性。我们在三个公开可用的 - Thelxinoë:使用瞳孔测量和机器学习识别人类情绪
使用瞳孔测量的虚拟现实情绪识别方法,通过分析虚拟现实头戴设备对视觉和听觉刺激的瞳孔直径响应,从时域、频域和时频域提取关键特征并利用特征选择获取最重要的特征,再应用集成学习技术中的梯度提升模型,通过特征工程将准确率从 84.9% 提升至 98 - 物联网入侵检测系统的多输入自编码器引导特征选择
该研究论文介绍了一种新的神经网络架构(Multiple-Input Auto-Encoder,MIAE),该模型通过无监督学习将异构输入转化为低维表示,并设计了特征选择层以选择信息丰富的特征。这种方法在检测入侵行为方面表现优秀,同时具有较快 - 逆向强化学习的自动特征选择
逆向强化学习是一种从专家示范中学习奖励函数的模仿学习方法,通过使用线性组合特征表示奖励,借助多项式基函数形成特征候选集来解决连续状态空间中特征选择的问题,并利用轨迹概率与特征期望之间的关联对特征进行选择,实验表明该方法能够恢复捕获专家策略的 - 多任务数据的通用特征选择方法
BoUTS 是一个通用且可扩展的特征选择算法,通过克服限制条件来提取与所有数据集相关的通用特征和与特定子集有预测能力的特定任务特征,并在七个不同的化学回归数据集上取得了靠前的特征稀疏性和预测准确性,具有在不同科学领域推进的巨大潜力。
- IGANN 稀疏:用非线性洞察力连接稀疏性和可解释性
我们提出了 IGANN 稀疏模型,这是一种广义加性模型的新颖机器学习模型,通过训练过程中的非线性特征选择来促进稀疏性,从而确保在不损失预测性能的情况下提高模型的解释性。
- 基于矩阵分解的无监督特征选择的核对齐
通过特征选择方法,将无关和冗余特征删除,以期获得原始特征的良好表示。本文构建了一个模型,通过集成核函数和核对齐,来解决非线性结构信息的捕捉问题。此外,还提出了一种多核学习方法,通过学习线性和非线性相似性信息,并自动生成最合适的核函数。在实验 - 医疗数据缺失值填补技术的性能评估
该研究比较了七种填补技术在三个医疗数据集上的表现,结果显示 Missforest 填补法表现最好,其次是 MICE 填补法;此外,研究还表明在处理包含缺失值的数据时,首先进行填补再进行特征选择效果更好。
- REFRESH: 由 SHAP 值指导的负责任和高效的特征重新选择
该论文介绍了特征重新选择的问题,提出了一种名为 REFRESH 的方法,利用 SHAP 值和相关性分析来重新选择特征,从而在不必训练多个新模型的情况下实现对模型性能的额外约束,实证评估结果表明 REFRESH 能够有效地找到具有更优模型特性 - FSDR:一种基于离散松弛的伪时间序列数据的新型深度学习特征选择算法
利用离散松弛学习的深度学习算法 FSDR,针对伪时间序列(PTS)数据中的特征选择问题,实验证明 FSDR 在考虑执行时间、$R^2$ 以及 $RMSE$ 的平衡时,优于其他三种常用特征选择算法。
- 利用近似共享特征连接领域
多源领域适应中的特征选择以及基于方差相关性的统计框架,通过学习过程提取近似共享特征,达到解决多源适应中优化策略的目的。
- 通过强化学习提高特征选择的分类性能
本研究通过采用强化学习算法(特别是 Q 学习和 SARSA 学习)来解决特征选择的挑战,评估其在优化分类任务中的效果,并以乳腺癌科英布拉数据集(BCCDS)和三种归一化方法(最小 - 最大、l1 和 l2)作为实验验证。结果显示,QL@最小 - 基于情感驱动的金融收益预测:一种贝叶斯增强的 FinBERT 方法
通过从推特中提取的情感信息,使用 FinBERT 大型语言模型的研究表明通过关联分析筛选特征集并采用贝叶斯优化的递归特征消除实现了超过 70% 的 F1 分数,从而在回测交易中获得了更高的累积利润。
- 通过单个预训练的加强代理指导的仿制品特征选择
我们引入一种创新的特征选择框架,通过强化学习,以模拟特征和经优化的 “knockoff” 特征指导特征选择过程,从而识别出最优和有效的特征子集。
- 特征选择作为深度顺序生成学习
我们提出了一种深度序列生成学习方法来进行特征选择,该方法通过学习连续嵌入空间,将特征选择决策序列映射为与效用分数相关的嵌入向量,从而解决了传统方法中存在的离散搜索空间和专家特定超参数的问题。
- 间接参数化具体自编码器
通过间接参数化的 CAE 模型 (IP-CAEs),在特征选择方面取得了显著而一致的改进,在多个数据集上能够更好地实现重建和分类的泛化能力和训练时间。