大数据概念简介

       最早提出“大数据”时代到来的是全球知名咨询公司麦肯锡,麦肯锡称:“数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。”

        一般认为大数据有以下几个特点:第一特征是数据量大。第二特征是数据类型繁多。第三特征是数据价值密度相对较低。第四特征是处理速度快,时效性要求高。这是大数据区分传统数据集挖掘最显著的特征。

    要想读懂数据,攫取数据的价值,就需要我们进行对数据进行挖掘。数据挖掘是通过自动或半自动化的工具对大量的数据进行探索和分析的过程,其目的就是发现其中有意义的模式和规律。

    数据挖掘可以对数据进行分类、估计(回归)、组合或关联法则、聚类、描述和可视化、异常检测。