- 足球中期望进球模型的全球 / 本地解释
该研究介绍了期望目标模型的全局解释(介于局部和全局之间),通过提出使用 SHAP 值和部分依赖配置文件的聚合版本,实现在团队和球员水平上进行性能分析,以从期望目标模型中提取球员或团队的知识而不仅仅是单个射门。此外,我们进行了真实数据应用来说 - AI 竞赛 - 使用统计复采样稳健地排名求解器
通过统计重采样技术,本研究调查了竞赛结果的普遍适用性问题,并提出了一种基于重采样性能数据的统计稳健解算器排名方法。应用于最近的 SAT、AI 规划和计算机视觉竞赛,分析结果显示了解算器性能的频繁统计并列以及与基于简单评分的官方结果相比的排名 - 无线联邦学习中数据异构的分析与优化
本文针对数据异构性与无线资源分配相结合的无线联邦学习问题,提出了性能分析与优化的方法,在考虑数据异构性的同时,优化客户端调度、资源分配和本地训练轮数,通过实验验证了该算法在学习准确性和能量消耗方面的优势。
- API 方面分析的对比学习
我们提出了一种新颖的方法 - CLAA - 用于 API 审查中的 API 方面检测,该方法利用了经过监督对比损失目标函数训练的 Transformer 模型。我们使用性能和影响分析来评估 CLAA。性能分析方面,我们利用了从 Stack - 基于图神经网络的潮流模型
本论文研究了使用图神经网络方法对历史电力系统数据进行训练,以预测电量流计算结果。通过在测试系统上的结果表明,使用所提出的图神经网络电量流模型可以比传统的直流(DC)功量流方法和深度神经网络(DNN)模型以及卷积神经网络(CNN)模型得到更准 - Graphtester: 探索基于图形数据集上 GNNs 的理论边界
本文介绍了一个新的工具 Graphtester,用于对 40 个不同的图形数据集进行分析,以确定各种 GNNs 的性能上限,并扩展其范围以对 Graph Transformer 进行分析,并提供了一个用于基准测试节点和边缘特征的合成数据集和 - 利用大型语言模型建模并行程序
本文介绍了如何将大型语言模型应用于高性能和科学代码的特定任务中,并通过实验展示了如何使用新模型 HPC-Coder 解决一些现有模型无法解决的问题。
- 带有卷积操作和且非卷积操作的 DNN 推理 / 训练性能分析
本文提出了一种针对深度学习加速器的性能分析框架 ——SimDIT,旨在覆盖卷积和非卷积操作,并提供详细的执行 CNN 推断和训练工作量的端到端性能统计,结果显示,在使用一个 64X64 处理阵列时,ResNet-50 训练工作量的非卷积操作 - 多视角 RGB 摄像机下的太极动作捕捉和表现分析
本文提出了一种基于多视角几何和人工智能技术的太极表演捕捉和分析框架,通过运动转移对移动序列的归一化建模来实现不同人群的太极表演分析。
- 高维情境臂材料问题无需稀疏
研究高维线性情境赌博问题,提出了探索后承诺(EtC)算法和自适应探索后承诺(AEtC)算法,通过分析表明这些算法可以在探索和利用之间找到最佳平衡,最终对算法的性能进行了评估。
- 具有外部时间进程的马尔可夫决策过程
本文研究在外部时间过程的影响下的马尔可夫决策过程,提出了一个策略迭代算法来解决这个问题,并对其性能进行了理论分析。
- GPTAraEval:基于阿拉伯语 NLP 的 ChatGPT 全面评估
本文介绍了一项大规模的 ChatGPT 在阿拉伯语自然语言处理方面的评估,结果显示,尽管该模型在英语基准测试上表现出色,但其在阿拉伯语数据集上的性能表现不如针对阿拉伯语进行优化的专用模型。
- ACLDMDD:一个大规模的数据集用于数据集提及检测
该研究介绍了 DMDD 数据集,它是目前用于科学文献数据集命名检测的最大公开语料库。通过对不同检测模型在 DMDD 上的表现进行分析,研究发现了数据集命名检测方面的一些问题,邀请社区使用该数据集开发新的检测模型。
- 使用顶部和背部视角的无人机视频姿态信息估计羽毛球双打的控制区域
本研究提出了一种基于视觉跟踪和深度神经网络的框架,通过控制区域概率图来评估双打比赛中的团队合作表现,并验证了其在实验室中的有效性,可以为比赛提供有价值的位置评估和指导。
- NorBench -- 挪威语言模型基准测试
NorBench 提供一套简化的 NLP 任务和探针,并引入了一系列新的挪威语言模型(包括编码器和编码器解码器),最后对其性能和其他现有的 LMs 在 NorBench 的不同基准测试中进行了比较和分析。
- ChatGPT 与现有模型的关键词生成任务基准研究
本研究对比 ChatGPT 与现有技术模型的关键词生成能力,探究其在应对领域适应性和长文本关键词生成方面的潜力。实验结果表明 ChatGPT 在不同数据集和环境中均优于现有技术模型,能生成高质量、适应多样领域和文本长度的关键词。
- 使用区块链技术的安全路由协议以缓解 MANET 中的攻击
介绍了 MANET 网络的安全性问题、攻击分类、以及基于 blockchain 技术的安全路由算法 (SRA),并通过 PDR 和吞吐量测试,分析了该算法的性能及与 Q-AODV 和 DSR 算法的比较。
- AI 聊天机器人是否能通过基本工程 (FE) 和工程原理与实践 (PE) 结构考试?
本论文尝试通过针对 ChatGPT-4 和 Google Bard 在工程基础和原则及实践考试中的表现的分析,探索聊天机器人是否能够通过这些考试。结论表明,现有版本的 ChatGPT-4 可以潜在地通过 FE 考试,并且聊天机器人可以成为工 - 比较 NARS 和强化学习:关于 ONA 和 Q-Learning 算法的分析
探讨了非公理推理系统(NARS)作为强化学习(RL)替代品的潜力,并进行了性能对比分析,结果表明 NARS 在不同难度环境中表现竞争力尤其是在非确定性环境中。
- 自监督学习中的进化增强策略优化
本文介绍了一种基于自主学习算法的预训练深度神经网络的方法,通过演化搜索方法在预处理任务的数据增益管道中编码数据增益算子的不同组合,优化所谓的‘拟预处理任务’,并测量了增强运算器对几个最先进的自监督学习算法性能的影响。研究结果表明,优化规则采