声学特定钢琴速度估计
提出了一个用于描述数字孪生中人工智能流程的领域特定语言(DSL),旨在简化数字孪生的设计和验证,通过将函数作为一等公民进行学习模型的有效操作,展示了 Function+Data Flow(FDF)在结构的塑性应变预测和轴承的电磁行为建模两个具体用例中的优势。
Jun, 2024
我们介绍了 modeLing,这是一种测试人工智能系统中少样本推理能力的新型 Linguistics Olympiad-style 谜题基准。通过从少数例子中推断一种语言的语法结构的各个方面,解决这些谜题需要一定的推理能力。modeLing 是专门为本研究编写的全新谜题,不会出现在现有 AI 系统的训练数据中,减少了数据泄漏对推理评估的潜在混淆因素。通过在我们的基准测试中评估多个大型开源语言模型和 GPT,我们观察到相当高的准确性,表明具备少样本新兴推理能力,不能仅归因于浅层记忆。然而,不完美的模型表现表明 modeLing 可以用来衡量语言推理的进一步进展。
Jun, 2024
音乐信息检索领域的自动音乐转录(AMT)是一项核心挑战,旨在将音频信号转换为音乐符号表示,本文扼要回顾了 AMT 在音乐信号分析中的关键作用,强调了由于音乐和谐的复杂和相互叠加的频谱结构而对 AMT 的重要性,通过对 AMT 中现有的机器学习技术的彻底研究,我们探讨了当前模型和方法的进展和限制。尽管有可观的进展,AMT 系统尚未达到人类专家的准确度,这在很大程度上是由于音乐和谐的复杂性和对细致解释的需求。本综述批判性评估了全自动和半自动的 AMT 系统,强调了最小用户干预的重要性,并研究了迄今为止提出的各种方法。通过解决先前技术的限制并提出改进的途径,我们的目标是引导未来的研究朝着能够准确且高效地将复杂的音频信号转化为精确的符号表示的全自动 AMT 系统。本研究不仅综合了最新的进展,而且为克服 AMT 中的现有挑战提供了一个路线图,为研究人员提供了有价值的洞察,旨在缩小当前系统和人类级转录准确性之间的差距。
Jun, 2024
本综述从以偏好为中心的角度回顾了探索大型语言模型(LLMs)的人类偏好学习的进展,包括偏好反馈的来源和格式,偏好信号的建模和使用,以及对齐 LLMs 的评估。
Jun, 2024
该研究提出了一种基于实际数据集的新颖的 5G 基站能耗建模方法,通过将基站标识符(BSID)信息纳入输入特征并使用嵌入层进行编码,以准确表示不同基站的能源指纹,并引入了掩码训练方法和注意机制来提高模型的泛化能力和准确性,在评估中实现了显著改进,将平均绝对百分比误差(MAPE)从 12.75%降低到 4.98%,性能提升超过 60%。
Jun, 2024
模拟和制造个性化颅骨植入物是可以缩短患有颅骨损伤患者等待时间的重要研究领域。个性化植入物的建模可以通过深度学习方法部分自动化,然而,该任务在使用以前未见过的数据分布时难以泛化,难以在实际临床环境中使用研究成果。鉴于获取地面真实注释的困难,必须考虑和引入不同的技术来改善用于训练深度网络的数据集的异质性。在这项工作中,我们对几种数据增强技术进行了大规模研究,包括经典的几何转换、图像配准、变分自动编码器、生成对抗网络以及最新的潜在扩散模型。我们表明,大量数据增强的使用显著增加了定量和定性结果,使得 SkullBreak 数据集的平均 Dice 分数超过 0.94,SkullFix 数据集的平均 Dice 分数超过 0.96。此外,我们展示了合成增强网络成功重建真实临床缺陷。这项工作对于人工智能在个性化颅骨植入物的自动建模领域做出了重要贡献。
Jun, 2024
化学工程中,使用物理信息的神经网络模型可以有效地进行过程建模,尤其对于缺乏实验数据和部分未知机理描述的情况下,其推断未测状态的准确性较高且泛化能力强,可作为一种有前景的研究方向进行深入探究。
Jun, 2024
通过建构情绪理论建立多层多模潜在狄利克雷分配模型来解释情绪概念的形成过程,并验证了该模型对主观人类情绪匹配度和未知信息预测的有效性。
Apr, 2024
使用先进的人类驾驶车辆模型和高斯过程学习相结合的方法来预测人类驾驶车辆的行为,并利用该模型开发了一种增强型模型预测控制策略,以提高混合车辆编队的安全性和运行效率。
Apr, 2024