- 使用监督机器学习在高分辨率太阳光谱中检测和分类耀斑
使用监督机器学习建立了一个标准化分类太阳耀斑的过程,并发现了 C-Support Vector Machine (SVC) 算法在分类太阳耀斑中的出色表现。该模型具有较高的分类准确度,在检测和分类太阳耀斑方面表现出了很强的适应性和准确性。未 - CVPRALINA:高级线路识别和标记算法
提出一种新的注释框架 ALINA 用于标注出租车道数据集,并使用其生成对应的像素坐标标注,从而在测试中显示了高达 98.45% 的检测率。
- 自动机器学习背景下的预测性能置信区间估计
在 AutoML 环境下,比较评估了 9 种最先进的方法和变体在置信区间(CI)估计方面的表现,以包含百分比、CI 的紧致性和执行时间为指标,结果支持 BBC-F 和 BBC 在所有度量指标上优于其他方法。
- 基于深度学习的无授权随机接入下的无蜂窝大规模 MIMO 用户活动检测方法
本文利用监督式机器学习模型来解决非正交前导序列设计条件下的用户活动检测问题,并介绍了一个针对 GF-RA 协议下的无线电波多输入多输出(CF-mMIMO)网络的数据驱动算法和新颖的聚类策略,模拟实验结果显示算法在真实场景中具有 99% 的准 - 用于评估延迟系统的因果框架
通过因果推断的方法,评估延迟系统对预测准确度的因果影响,区别两种场景,一种是能够接触到人类和机器学习模型的预测结果,另一种是只有人类预测结果可用,通过这种方法在合成和真实数据集上对七种延迟系统进行了实证评估。
- 大型語言模型增強的機器學習分類器
利用预训练的大型语言模型 (LLM) 对经典的监督机器学习方法进行增强,以应对分类问题,并提出了几种将 LLM 集成到经典机器学习估计器中的方法,从而进一步提高预测性能。通过标准的有监督学习二分类任务和数据分布发生变化的迁移学习任务,对所提 - 基于分类树的主动学习:一种封装方法
使用包装器主动学习方法对分类问题进行改进,通过在初始标记样本上构建分类树,将空间分解为低熵区域,再使用基于输入空间的准则从这些区域中进行子采样,并证明了该方法在使用受限标记数据集时构建准确分类模型的有效性。
- 哥伦比亚地热梯度预测:机器学习方法
使用监督机器学习和可用的直接测量结果预测地热梯度,并得到 12%精度内的准确预测,验证了模型的可靠性,并呈现了哥伦比亚的地热梯度地图。
- 基于混合密度网络的星系三维形状恢复
利用混合密度网络 (MDN) 的监督式机器学习方法,使用投影星体运动学和通量分布,恢复了个体星系的三维形状,并展示了 MDN 模型在获取三维星系形状及其不确定性方面相比以往方法的潜在改进,尤其是对纵椭圆和三轴系统。针对现有和未来的积分场光谱 - 深度领域适应:一种用于改进眼动跟踪系统的仿真到真实的神经方法
使用降维技术衡量目标眼睛图像和合成训练数据之间的重叠,并修剪训练数据集以最大化分布重叠,从而解决模拟和实际数据样本之间的差异,从而实现鲁棒的、改善的性能。
- 基於 usfAD 的高效未知攻擊檢測專注 IDS 框架
通过半监督学习技术开发入侵检测系统,建立了两种策略:1)使用随机和均匀分布的合成攻击样本训练有监督机器学习模型;2)构建一种仅基于良性网络流量训练的一类分类模型。实验证明,基于最先进的异常检测技术 usfAD 的一类分类模型在考虑真实场景并 - 海底工程异常检测的有监督时间序列分类
通过监测物理系统的仿真数据,我们使用监督机器学习分类算法对时间序列进行分类,并讨论了时间序列数据预处理、统计分散度和降维技术。我们提出了一种直观的基准方法,并讨论了其效率,并通过不同性能指标的比较,展示了使用机器学习技术在决策中的优势。
- 物理相容和无监督的黎曼领域适应,用于异构脑电数据的机器学习
应用电脑脑电波信号物理学的方法,通过字段插值将脑电通道映射到固定位置,实现源域适应,提高了脑机接口和潜在生物标志应用的分类性能。
- 基于数据驱动的监督式机器学习方法估计全球环境空气污染浓度及其相关预测区间
通过数据驱动的监督机器学习框架填补空缺的时间和空间测量来生成全面的污染物数据集,为依赖室外空气污染数据进行下游评估的各方提供了具有 0.25 度细粒度和小时间隔的数据,同时为每个估计值提供了预测区间,从而支持更详细的研究。还通过检查模型在不 - 机器学习和统计方法在数字高程模型(DEM)校正中的比较:中期结果
研究探讨了使用机器学习方法纠正数字高程模型中的高程偏差。通过对三种机器学习方法和多元线性回归方法在提高 Cape Town 地区 Copernicus 和 AW3D 全球 DEM 的垂直精度方面的比较,结果显示梯度提升决策树方法在 DEM - 使用逻辑回归进行特征选择的实验
在监督式机器学习中,特征选择扮演着非常重要的角色,可以通过计算时间和精确度等指标来提高可解释性和性能。本文研究了一种基于逻辑回归(LR)的著名 L1 和 L2 正则化策略的特征选择方法,并综合了 L1 和 L2 正则化的发现,在 CIC-I - 大型语言模型与监督建模在乳腺癌病理分类中零样本推理的比较研究
通过对 769 份乳腺癌病理报告进行人工标注的数据集的研究,我们比较了 GPT-4 模型和 GPT-3.5 模型的零样本分类能力与三种模型架构的监督分类性能,发现 GPT-4 模型在所有 13 个任务中要么显著优于要么与最佳监督模型的 LS - 从学生话语中预测挑战时刻:GPT-4 与两种传统自然语言处理方法的比较
本研究调查了利用专家知识规则模型、监督式机器学习模型和大型语言模型(LLM)从学生讨论中检测挑战和识别挑战维度(认知、元认知、情感和技术 / 其他挑战)的潜力。结果显示,监督式机器学习和 LLM 在两个任务中表现出色,而基于规则的方法则主要 - MM自动内容分析的少样本学习:对乌克兰军火交付辩论中论点和主张的高效编码
使用多语言 Transformer 模型和适配器扩展加上少样本学习方法的组合,成功地在沟通科学领域的实际案例中实现了通过自动检测声明和论据并确定其立场来改善包括复杂语义类别编码在大数据集上的自动内容分析,提供了与完全微调 PLMs 相媲美的 - 基于增强树的基于模型不确定性的表格数据主动学习
本研究探讨了基于提升树的主动学习方法对表格数据的有效性,利用模型不确定性进行样本选择,并针对回归任务提出了一种成本效益高的主动学习方法,同时也提出了改进的成本效益高的分类任务的主动学习方法。