第412章 大数据营销(2 / 5)

bsp;  而 Google的思路是部署一个大规模的服务器集群,通过分布式的方式将海量数据存储在这个集群上,然后利用集群上的所有机器进行数据计算。这样,Google其实不需要买很多很贵的服务器,它只要把这些普通的机器组织到一起,就非常厉害了。

    2006年,Doug Cutting将这些大数据相关的功能从 Nutch中分离了出来,然后启动了一个独立的项目专门开发维护大数据技术。

    这就是后来赫赫有名的 Hadoop,主要包括 Hadoop分布式文件系统 HDFS和大数据计算引擎 MapReduce。

    Hadoop发布之后,Yahoo很快就用了起来。大概又过了一年到了 2007年,百度和阿里巴巴也开始使用 Hadoop进行大数据存储与计算。

    2008年8月由维克托·迈尔·舍恩伯格和肯尼斯·库克耶在编写《大数据时代》中将“大数据”这个概念完整的阐述出来。

    其实“大数据”这个名词本身出现的还要早,1980年未来学者托夫勒在《第三次浪潮》中首次使用了大数据这个名词。

    2002年,美国政府在911之后以反恐的名义开始涉足大数据挖掘领域。

    “互联网存在着海量的数据,而这些数据都是人与机器交互产生的。”秦少言用力拍着那几个英文字母,“只要经过就必然留下痕迹,也就是数据。”

    “每个人每天会产生多少数据,一周呢?一年呢?一万人和十万人呢?”

    “这些数据是什么?是财富是宝藏!”

    “互联网公司的价值除了概念以外什么最值钱,当然是数据!”

    秦少言随后看向了熊潇歌,“当然,我要在这里插一句,你们做互联网风投的对数据的价值远远低估了。”

    熊潇歌刚要张嘴反驳,秦少言马上说道:“不过这个也不能怪你们,是现在的互联网从业者对数据的利用手段太少,利用率太低,没有充分挖掘其中的价值。”

    “如果能把数据中真正的价值发挥出来,我们快播网和校园网的估值起码要翻二到五倍。”

    “这不可能!”熊潇歌斩钉截铁的反驳道,“两倍都多了。”

    秦少言也不争辩,微笑的说道:“大数据可以做很多事情,可以突破大家的想象。”

    “心理学上有一个概念叫做侧写,用一个人的行为方式推断出他的心理状态,从而分析出他的性格、生活环境、职业、成长背景等。”

    “在互联网上一个人的行为就是数据,大数据挖掘技术就是侧写,它可以收集整理数据后进行分析,从而知道这个人的一切,甚至能预测他的行为。”

    “美国有一家叫奈飞的在线影片租赁服务商,他们搞了一个用户推荐机制,根据用户在网站租赁碟片的类型来分析用户的喜好,然后进行有针对性的推荐。”

    “我在维尔福公司为他们开发在线游戏平台steam的时候也要求他们做了类似的功能。为不同国家、不同喜好的玩家针对性的推荐游戏。”

    “我们可以针对一个用户喜好推荐商品,刺激他购买。针对他的偏好,推荐他喜欢的视频,针对他的阅读偏好推荐文学作品,甚至我们可以针