BriefGPT.xyz
大模型
Ask
alpha
关键词
data pipelines
搜索结果 - 4
基于 Bauplan 和 Nessie 的可重现数据湖数据科学:可回放数据流水线
介绍了在面临数据湖中数据工作负载可重现性的挑战时,Bauplan 在解决此问题方面的最新进展,通过将计算与数据管理解耦,并利用具有 Git 语义的开源目录 Nessie 以及云运行时,展示了系统提供时间旅行和分支语义以及通过少数 CLI 命
→
PDF
2 months ago
基于区块链的异构信息系统数据管道保护模型
提出了一种基于区块链的模型来保护异构信息系统中的数据通道,使用综合多灾害预警系统(MHEWS)作为案例研究,以解决数据通道中存在的安全和隐私问题,该模型利用区块链技术的固有安全特性,以分散方式确保数据的完整性、保密性和真实性,并在混合环境中
→
PDF
6 months ago
KDD
通过历史自动验证:自动编写数据质量约束来验证经常性数据管道
提出了 Auto-Validate-by-History (AVH) 算法,该算法能够自动检测经常性的数据管道中的数据质量问题。在 Microsoft 的 2000 个生产数据管道的评估中表现出了其效果和效率。
PDF
a year ago
Vakyansh: 适用于资源稀缺的印度语言的 ASR 工具包
Vakyansh 是一个 Indic 语言语音识别端到端工具包,通过自动数据流水线实现数据创建,训练和部署,提供了适应于 18 种 Indic 语言的最先进的语音识别模型,并开放了所有这些资源来支持语音开发者社区。
PDF
2 years ago
Prev
Next