Quantcast
Channel: InfoQ - 促进软件开发领域知识与创新的传播
Viewing all articles
Browse latest Browse all 1056

百度机器学习课程 (四):跨上大数据的战车

$
0
0

数据量和数据内涵的增长曲线

首先,这是我们近些年观察到的,不光是互联网,整个中国的各个行业都在发生的一个事情:我们的数据量和数据的内涵在进行一个非曲线的快速增长。这里,我首先说一下数据量的非线性增长,随着收集手段不断的先进化,随着日常工作和生活不断的 it 化、移动化,我们能够收集到的数据肯定是一个非线性增长的。但是,什么叫做信息的内涵非线性增长,它指的是如果有两个不同类型的数据,我们把这两个类型的数据结合在一起,它们产生的价值是1+1>2的。比如,一个人从他早上开始起来,可能就开始登陆一个论坛浏览新闻,之后可能会对去哪度假感兴趣,所以搜索了很多度假相关的事情,白天上班,他可能又搜索了很多跟他工作相关的一些问题,最后晚上回家,他可能又去网上购物,或者把之前看好的一些要出行的行程定下来,在整个白天上下班使用交通工具的时候,他又通过地图留下了很多位置移动的数据。如果我们把这位普通人一天生活的方方面面的数据都集合在一起,会发现我们对一个人的了解要深刻的非常多。这也就是说我们每一个数据如果是1的话,我们把所有这些1加起来,其实要大于它们本身单独刻画之和的。这就是说即使我们数据量是线性增长的,我们如果有这种累加项的话,我们整个信息的内涵也是在非线性增长的,更别提数据量本身也在非线性的增长。

为何要跨上大数据的战车?

1. 攻:促进业务发展

接下来考虑下,作为一个业务的负责人,为什么我们今天说一定要跨上大数据的战车呢?可以从功和守两方面进行总结。首先我们先从攻的角度进行总结,攻的角度是可以促进业务发展。

假设有这样一个业务,提供给用户的价值是基于数据和数据技术进行搭建的,它的价值与数据量是息息相关的。假设数据量出现一个非线性的爆发式增长,那么,业务价值或者提供给用户的价值,以及业务的商业价值,是不是也可以出现非线性的爆发式增长?也就是说如果我们的业务是基于数据和数据技术来进行优化的,那我就会骑上这样一个数据增长曲线,使我的业务价值出现一个突飞猛进的增长。这样的思路,有点类似于“大鹏一日同风起,扶摇直上九万里”。所以,大家想跨上大数据战车,从攻的角度来说,是期望业务的发展可以跟数据量的增长绑定起来,随着数据量的增长,会使业务发展的越来越好,业务价值越来越高。


Viewing all articles
Browse latest Browse all 1056

Trending Articles