- 大型语言模型的协同性能预测
通过利用历史性能和其他设计因素,我们引入了一种新的框架 Collaborative Performance Prediction (CPP) 来显著提高性能预测准确性,该框架不仅超越了传统的缩放法则在预测扩展 LLMs 的性能方面,还促进了 - 概率回归树集成
该研究使用基于树的集成方法,如随机森林、梯度提升树和贝叶斯增加回归树,在许多应用和研究中成功地用于回归问题。本文研究了概率回归树的集成版本,通过将每个观测分配到相对应的概率分布区域,为目标函数提供平滑逼近。我们证明了所考虑的概率回归树的集成 - 同构工具的自适应选择:在 RAG 场景中的实例化
本文主要研究工具学习中的成本效益问题,通过预测同质化工具的性能和相关成本,以便在成本有效的方式下为给定任务分配最佳工具。实验证明,我们的方法相对于基准方法,在性能和成本方面取得了更好的结果。
- ProxyLM:通过代理模型预测多语言任务上的语言模型性能
ProxyLM 是一种可扩展的框架,通过使用代理模型在多语言任务中预测语言模型性能,减少与模型容量和微调数据相关的计算成本,大大降低了任务评估的计算负荷,同时展示了适应预训练语言模型中以前未见过的语言,提高了性能,并通过简化模型选择实现了高 - 神经图特征的惊人强大性能预测
通过一种简便可行的图形特征计算方法,GRAF (神经图形特征) 在预测网络性能的同时超越了零成本代理和其他常见编码方法,成为性能预测的大多数现有预测器中成本较低且表现最好的一种。
- 从指令中预测第三方语言模型的性能
在现代自然语言处理系统中,基于语言模型的指令跟随系统表现出越来越高的性能,但这些系统往往没有透明度,缺乏明确的性能限制,因此我们提出了一种第三方性能预测框架,通过训练一个独立的模型来预测在任务中评估指令跟随系统时的指标结果,从而揭示现代指令 - 从硬件规格预测笔记本电脑用户体验
通过硬件规格预测设备用户体验在实际应用中的表现,对于厂商来说是一个常见的挑战。使用了梯度提升回归树模型,通过设备规格预测了在常见用户工作负载下的用户体验指标,并在数据集上达到了 97.8% 的拟合优度和 10.1% 的预测误差。
- 使用顺序元学习在多个环境中预测配置性能
通过设计 SeMPL - 一个元学习框架,从在不同(元)环境中测量的配置中学习共同理解并将其推广到未知的目标环境,本文针对多个环境下的配置性能学习进行了研究,与 15 种最新技术模型进行对比实验,结果显示 SeMPL 在 89% 的系统上表 - 教育数据挖掘中深度学习技术的综合调研
教育数据挖掘 (EDM) 是一个重要的研究领域,利用计算技术分析教育数据。深度学习技术在处理教育数据分析和建模的挑战中表现出明显优势。本综述旨在系统回顾 EDM 与深度学习的最新研究进展,介绍 EDM 和深度学习的背景以及其在现代教育中的重 - 深度知识追踪是一种隐式的动态多维项目响应理论模型
深度知识追踪是一种基于递归神经网络的知识追踪竞争模型,本研究提出了一种简化的解码器,比原有模型表现更好,并为未来研究方向提供了新的可能性。
- 零成本代理的评估 -- 从神经架构性能到模型鲁棒性
本研究分析了常见的零成本代理在 NAS-Bench-201 搜索空间中作为鲁棒性性能预测器的能力,发现预测鲁棒性使得现有的零成本代理预测任务更具挑战性,需要联合考虑多个代理才能预测模型的鲁棒性。
- 利用强化学习预估移动益智游戏玩家完成率
研究使用强化学习代理的性能来估计 Lily's Garden 移动益智游戏不同难度及玩家的完成率,发现人类行为与代理行为的差异 highly correlated,依旧可用代理性能估计和建模玩家指标。
- 大型语言模型能力的可预测性研究 —— 以 BIG-bench 为例
研究了大型语言模型预测能力的可预测性问题并在 BIG-bench 实验记录上进行了实证研究,发现大型语言模型的性能可以以 5% 以下的 RMSE 进行准确预测,并提出了寻找一个信息性子集用于评估新模型家族的问题,整合了 BIG-bench - CVPR使用 GP-NAS 堆叠集成模型预测 NAS 多任务
本文描述了如何通过处理数据、锻炼、并使用 GP-NAS 进行堆叠集成模型来准确预测体系结构的性能,并成功在 CVPR 2022 Track 2 Challenge 中排名第一。
- 机器学习算法和特征提取技术的可预测性
本论文研究了基于矩阵分解的预测系统,旨在预测特定数据集上特定模型的分类准确性。通过超过 50 个数据集的全面实证研究,着重于研究三种基础机器学习算法(随机森林、XGBoost 和 MLP)的性能预测,包括粗调和变体微调模型的可预测性,利用特 - 使用深度学习技术预测编程竞赛参赛者的表现
本研究提出了一个框架,基于选手之前参加比赛的表现和练习情况,预测参加 Codeforces 平台竞赛的选手在未来比赛中的表现和评级。
- 利用知识图谱预测模块化优化算法的性能
本文提出了一种基于改进后的 OPTION 本体构建的知识图谱的性能预测模型,并使用模块化算法框架来构建知识图谱,以预测给定算法实例是否能够针对给定问题实例实现某个目标精度。
- RF+clust 用于留一问题外性能预测
研究自动算法配置和性能预测的方法,在机器学习中使用 “留一问题”,分析了随机森林模型和基于余弦相似度测量特征相似性阈值对预测性能的影响,并提出了零样本学习环境下的特征选择问题。
- NAS-Bench-Suite-Zero:加速无成本代理研究
本文介绍了 “Zero-cost proxies”(零成本代理)的性能预测技术,计划显着加快神经架构搜索算法,并创建了 NAS-Bench-Suite,结合 13 个零成本代理模型用于更快的实验,同时提高了预测性能。
- TEP-GNN: 使用图神经网络准确预测功能测试的执行时间
该论文提出了一种基于流量增强的 AST 和图神经网络模型的高精准度性能预测方法 TEP-GNN,其在四个现实情况下的 Java 开源项目中被证明是可行的,但需要进一步工作来使训练的模型适用于其他未知项目。