Quantcast
Channel: InfoQ - 促进软件开发领域知识与创新的传播
Viewing all articles
Browse latest Browse all 1056

数据湖,大数据的下一个变革!

$
0
0

让数据产生价值才叫成功。早期有不少的公司引入了Hadoop,将企业的各种结构化非结构化数据加载至Hadoop环境当中,想让自己的数据发挥更大的价值,但这并不容易。2016年,Gartner公司估计有60%的大数据项目遭遇失败。一年之后,他们表示60%的估计太过保守,这个数字应该是85%。

大数据存储已经走到了一个新的阶段,肯定会有新的革命性技术来替换它。

大数据的未来

前十多年,大数据的发展主要集中在技术框架上,社区出现了一系列优秀的作品,如最开始引领大数据风潮的 Hadoop,到计算引擎Spark、Flink ,消息中间件 Kafka ,以及资源调度器 Kubernetes 等等,大数据领域的技术框架已经比较成熟。

通过开源架构策略,现代化数字企业逐渐意识到自己的目标是通过业务实现数据的价值化,未来将会把更多的精力投向研究底层数据消费和上层的产品应用。

2019年6月,谷歌以 26 亿美元收购了数据分析公司 Looker。同月,Salesforce 宣布以 157 亿美元收购BI企业Tableau 。2019年9月,Cloudera 宣布收购商业智能实时分析厂商 Arcadia Data。这些收购案例都说明企业的目标开始转向解读所积累的海量数据。

赋能业务,快速应对挑战,正是数据湖所能提供的。数据湖的概念,最早是在2011年由Dan Woods提出,”是一个集中化存储海量的、多个来源,多种类型数据,并可以对数据进行快速加工,分析的平台,本质上是一套先进的企业数据架构“。例如在社交广告中的用户画像,需要行为日志等非结构化数据,经过层层数据加工形成业务价值。以后也会延伸到图像、语音等类型。这些就是数据湖能提供的特别优势。


Viewing all articles
Browse latest Browse all 1056

Trending Articles