- KeyVideoLLM:面向大规模视频关键帧选择
通过基于文本 - 视频帧相似度的关键帧选择方法,KeyVideoLLM 能够高效、鲁棒、有效地管理 VideoLLM 数据,并在视频问答任务中显著改善模型性能,实验结果一直保持在最新技术的前沿。
- 作为复合人工智能工具链的自由实体匹配
通过动态工具使用、自我细化和优化,Libem 支持实体匹配,允许根据数据集和性能指标进行适应和优化,与传统的独立 AI EM 系统相比,Libem 提供了可组合和可重用的工具链,以促进 AI 驱动的数据管理的讨论和发展。
- Swarm Learning:概念、应用与趋势综述
Swarm Learning is a decentralized machine learning framework that leverages blockchain technology to address privacy and - Follow-Me AI: 智能环境下的高效能用户交互
介绍了 Follow-Me AI 的概念,旨在增强用户与智能环境的互动,优化能源使用,并提供对这些环境捕获的数据的更好控制。该概念通过陪伴用户的 AI 代理进行数据管理协商,将环境控制与用户通信进行调整,并根据用户偏好和行为预测主动调整智能 - 政党内部民主的人工智能
人工智能可以增强政党内民主流程的测量与实施,通过特定的数据管理和机器学习技术,可以改善政党内民主的测量和实践,但也存在着数据隐私、操纵潜力和过度依赖技术的风险。
- 事件管理的 AIOps 解决方案:技术指南与综合文献综述
提供了一种 AIOps 术语和分类法,建立了结构化的事故管理程序,并提供了构建 AIOps 框架的指南,以提供 AIOps 领域的技术和研究方面的全面回顾,旨在构建知识,识别差距,并为该领域的未来发展奠定基础。
- A2CI:面向大气研究的基于云计算和服务的地理空间基础设施
大地科学数据、地理空间基础设施、数据发现、数据管理以及大气科学研究是本论文的关键词,该论文介绍了一个通过云计算原则构建的气象分析系统的实施。
- 使用 LSTM 设计和实施一个自动化的 Kubernetes 集群灾难恢复系统
该研究介绍了将 Kubernetes 管理平台与备份和恢复工具集成的系统结构,实现在云环境中自动检测灾难并从另一个 kubernetes 集群中自动恢复应用程序,从而显著提高了云环境中数据管理和恢复效率。此外,该研究通过 Long Shor - LLM 增强数据管理
LLMDB 是一种通过应用机器学习和大型语言模型优化数据管理问题的范例,具有高泛化能力和推理能力,可避免幻觉问题,并通过引入特定领域的知识、矢量数据库和 LLM 代理来提高准确性,其中三个真实场景包括查询重写、数据库诊断和数据分析。
- AutoIE: 从科学文献中自动提取信息的自动化框架
该研究介绍了一种自动提取科学论文中关键数据的创新框架,通过对科学 PDF 文档的布局分析、科学文本的功能块识别、分子筛合成信息的提取和关联以及分子筛文献的在线学习等四个组件的独特集成,实现了对未来研究方向的更易辨析,提高了分子筛合成领域数据 - ZnTrack -- 数据即代码
过去十年在计算领域取得了巨大的突破,并且没有任何迹象表明这种发展会减缓。机器学习、大规模计算资源和增加的行业关注导致对数据管理、模拟和模型生成的计算驱动解决方案的投资不断增加。然而,这种计算的增长也带来了数据规模更大的扩展,以及在数据存储、 - 构建一致性语言模型的声明式约束
研究介绍如何利用数据管理领域的方法和工具解决大型语言模型返回不一致答案的问题,并提供一些初步的实证研究。
- 无线 MEC 网络中动态资源分配的安全深度强化学习
本文提出了一个基于区块链安全的深度强化学习优化框架,用于分散的无线移动边缘计算网络中的数据管理和资源分配。我们设计了一种低延迟的基于声誉的股权证明共识协议,用于选择高可靠的区块链启用的基站,以安全存储移动边缘计算用户请求并防止数据篡改攻击。 - 大规模语言模型的数据管理:一项调查
数据管理在大型语言模型的训练中起着基础性的作用,本文调查了数据管理在预训练和有监督微调阶段的各个方面,包括数据数量、数据质量、领域 / 任务组成等,为构建强大的大型语言模型提供了指导资源。
- 基于数据管理的 GNN 训练系统的综合评估
该论文从数据管理的角度对图神经网络 (GNN) 训练进行了回顾,并提供了代表性方法的全面分析和评估,通过在各种基准数据集上进行广泛实验展示了许多有趣且有价值的结果,同时提供了一些从实验中学到的实用技巧,有助于未来设计 GNN 训练系统。
- 智能数据管理与洞察力的农业转型
现代农业面临着在气候变化和自然资源减少的限制下,满足食品、燃料、饲料和纤维的不断增长需求的巨大挑战。数据创新迫切需要确保和提高农业生态系统的生产力、可持续性和弹性。本文介绍了满足 FAIR 原则的农业数据管理和分析(ADMA)系统,该系统通 - 基于大数据的空域拥塞预测
提出了一种新的数据管理和预测系统,可准确预测国家空域系统(NAS)特定空域区域内的飞机计数。对美国的大量实际轨迹、天气和空中交通数据进行评估,验证了我们的系统在每个空域部门高效准确地预测飞机计数。
- pose-format:用于查看、增强和处理.pose 文件的库
这篇论文介绍了 pose-format,它是一个综合工具包,通过提供统一、灵活和易于使用的接口来解决姿势数据管理和分析的复杂性。pose-format 具有专门的文件格式,可以封装多种类型的姿势数据,适用于图像和视频数据。该工具包还与 Nu - 基于信息融合的动态时空摘要
我们提出了一种动态时空数据汇总技术,它能够识别关键时间步骤中的信息特征并融合不太相关的特征,从而在保留数据动态性的同时最小化存储需求。利用信息论度量指导融合过程,我们展示了该技术在多样化数据集中的灵活性,并在粒子流模拟、安全监控应用和免疫系 - SEED: 大型语言模型下的简单高效有效数据管理
SEED 是一种面向 LLM 的系统,允许用户轻松创建高效和有效的数据管理应用程序,通过提供代码生成、模型生成和增强 LLM 查询等主要组件来解决 LLM 服务计算和经济上的挑战,并展示其在不同数据管理任务中的效率和有效性。