BriefGPT.xyz
大模型
Ask
alpha
关键词
data lakes
搜索结果 - 5
KDD
赋能数据网格的联邦学习
数据架构的演变引发了数据湖的崛起,旨在解决数据管理的瓶颈并促进智能决策。然而,这种集中式架构受到数据源增多和及时分析处理需求增长的限制。提出了一种新的数据范式,Data Mesh,以克服这些挑战。将数据所有权从中心团队分布到每个数据域,同时
→
PDF
3 months ago
模型湖泊
给定一组深度学习模型,找到适合的模型、理解模型、区分模型以及模型之间的差异是困难的。目前的从业者依赖手动编写的文档来理解和选择模型。然而,并非所有模型都有完整和可靠的文档。随着机器学习模型的增加,找到、区分和理解模型的问题变得更加关键。针对
→
PDF
4 months ago
检索、合并、预测:利用数据湖增强表格
数据湖中的数据发现在表增强中的应用进行了深入分析,研究了检索可连接表、信息合并和使用生成表进行预测的替代方法,并通过对 YADL 和 Open Data US 的系统性探索,总结了准确检索连接候选项的重要性和简单合并方法的效率。本研究报道了
→
PDF
5 months ago
数据湖中的语义数据管理
数据湖系统中的语义数据管理及可扩展性对大数据具有挑战,本研究回顾了最近的方法,重点关注数据湖系统内的应用,涉及基本语义数据管理、丰富数据湖中元数据的语义建模方法和基于本体的数据访问方法,同时指出未来工作中需要更紧密地集成大数据和语义 Web
→
PDF
8 months ago
LakeBench:数据湖上的数据发现基准测试
在数据湖之中,企业内部需要智能地进行数据发现,特别是关于找到相关的数据表。该文提出了使用不同数据源的表格来开发多个用于这些任务的基准测试,并比较了 4 个公开可用的表格模型在这些任务上的表现,结果显示这些模型在数据发现任务上有很大的改进空间
→
PDF
a year ago
Prev
Next