加入收藏 | 设为首页 | 会员中心 | 我要投稿 南通站长网 (https://www.0513zz.cn/)- 专有云、图像技术、经验、数据治理、专属主机!
当前位置: 首页 > 站长资讯 > 动态 > 正文

选择数据湖架构的5大理由

发布时间:2021-03-16 11:57:10 所属栏目:动态 来源:互联网
导读:用类似表格的形式。数据仓库是一种固定形式的解决方案,它不是敏捷的,同时意味着额外的重新配置成本。但迄今为止,它一直是全球企业的首

用类似表格的形式。数据仓库是一种固定形式的解决方案,它不是敏捷的,同时意味着额外的重新配置成本。但迄今为止,它一直是全球企业的首选。

那么,将数据湖作为数据管理选项的主要原因有哪些?

削减成本

因为在存储数据之前不需要设计数据的模式,所以没有前期的开发费用。且处理数据湖的Hadoop系统是开源的,因此没有额外的软件许可成本。

与传统数据仓库的不同之处在于,有了数据湖,ETL阶段就完全没有了。您不必知道存储在湖中的数据类型或者有多少字段。删除ETL过程意味着没有与许可、维护或增长数据结构相关的成本。

敏捷性

添加新单元或单个新项目可能会改变现有的整个数据结构,从而引发额外的成本。此外,进行这些更改所需的实现时间可能从几天到几周不等。

在数据湖中,所有的数据都已经存储,并且只有很少的变化,您可以随时查询。

这种方法帮助企业在当今不断变化的数据世界中保持敏捷性。未来几年里可能会出现新的数据格式,其中一些甚至是现在还无法预见的。因此,企业数据存储系统需要足够灵活,在不进行重大结构更改的情况下满足所有既定和突发要求。

多种格式

数据湖可以处理各种数据格式。即使数据湖中的一些数据看起来与其他数据无关,但从整体的角度进行组合和分析时,它可以提供基本的业务见解。

例如,如果一个数据湖包含关于客户的记录,比如姓名、年龄、去年的支出,以及客户在网上商店的行为统计图,很难看出这些细节和销售线索之间的直接联系。然而,把所有的东西放在一起,可以发现一定年龄的客户往往会更快地做出购买决定,这可能会影响销售策略。

除了多种格式,还有关于数据源的上下文透视图。最常见的资源包括面向客户的应用程序、BI应用程序、销售日志等。物联网的兴起将增加数据源和格式的数量,使数据湖成为唯一可靠的解决方案。

人工智能

由于数据湖使用非结构化数据,因此不适合使用传统的基于sql的工具进行查询。相反,由于大多数数据都具有合适的3v(体积、速度、多样性),因此可以将其视为大数据并用于训练人工智能算法。

(编辑:南通站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    热点阅读