分享|全面认知互联网大数据之三大“解构”


中国产业经济信息网   时间:2017-10-17





  网络信息时代的高速发展,科技发达,信息通达,人与人之间的交流越来越密切,生活也越来越便捷了。大数据是互联网科技发展到今天的必然产物。在以云技术为代表的革新下,那些原本很难收集和使用的数据开始容易被收集使用了,在各行各业的不断革新下,大数据逐步变为现实并创造着更多的价值。
 

 
  近年来,有人讲大数据,有人讲云计算,有人讲人工智能,当一件事情几个方向都在都在谈的时候,意味着一个时代的来临。那么,如何系统化地认识大数据呢?本文将从三大层面来展开,"解构"大数据。
 
  第一层:理论
 
  理论是认知的必经途径,也是被广泛认同和传播的基线。大数据的定义及特征是对大数据的整体描绘与定性;我们先从其定义与特征出发,来具体认知大数据。
 
  定义:大数据(bigdata),指在一定时间范围内无法用常规软件或工具进行捕捉抓取、管理和处理的数据集,而是需要新处理模式才能更具有强的决策力、洞察力和流程优化能力等的海量、多样化和高增长率的信息资产。
 
  特征:业界(IBM最早定义)将大数据的特征归纳为4个"V"(量Volume,多样Variety,价值Value,速Velocity),或者说特点有四个层面:第一,海量数据量。第二,数据类型繁多。第三,价值密度低,商业价值高。第四,速度快。第四点也是和传统的数据挖掘技术有不同本质。
 
  第二层:技术
 
  技术是大数据价值体现的手段和前进的基石。那么,现阶段和大数据相关的技术有哪些呢?这里将分别从云计算、分布式处理技术、存储技术和感知技术来说明大数据从采集、处理、存储到形成结果的全部过程。
 
  云技术
 
  在人工智能时代,互联网是基础设施,云计算是公共服务,那么大数据则是生产资料。大数据,离不开云计算,实时的大数据集分析需要分布式处理框架来向数以万计的电脑分配工作。再或者,我们可以打个比方来说:如果云计算充当了工业革命时期发动机的角色,那么大数据则是电。
 
  分布式处理技术
 
  分布式处理系统可以用用通信网络将具有不同功能的或不同地点的,拥有不同数据的N台计算机连接起来,分布式处理系统的定义是指:在控制系统的统一管理控制下,协调地完成信息处理任务。
 
  存储技术
 
  大数据可以抽象的分为大数据存储和大数据分析,这两者的关系是:大数据存储的目的是支撑大数据分析。大数据存储与大数据分析,其实还是俩种不同定义。大数据存储致力于研发可以扩展至PB甚至EB级别的数据存储平台;大数据分析关注在最短时间内处理大量不同类型的数据集。
 
  感知技术
 
  大数据的采集和感知技术的发展是紧密联系的。以传感器技术,指纹识别技术,RFID技术,坐标定位技术等为基础的感知能力提升同样是物联网发展的基石。这些感知被逐渐捕获的过程就是被数据化的过程。
 
  第三层:实践
 
  实践是大数据的最终价值体现,具体来说,现在城市都在走向智能和智慧,比如,智能电网、智慧交通、智慧医疗、智慧环保、智慧城市,这些都依托于大数据,可以说大数据是智慧的核心能源。如在舆情监控方面,通过搜索网络关键词以及语义智能分析,可以提高舆情分析全面性、及时性。在管理交通方面,实时挖掘道路交通信息,可有效缓解交通拥堵,并快速响应突发状况,为城市交通的有效运转提供科学依据。
 
 
  此文为新浪财经头条(产经头条)原创内容,特此声明
 

  【版权及免责声明】凡本网所属版权作品,转载时须获得授权并注明来源“中国产业经济信息网”,违者本网将保留追究其相关法律责任的权力。凡转载文章及企业宣传资讯,仅代表作者个人观点,不代表本网观点和立场。版权事宜请联系:010-65363056。

延伸阅读



版权所有:中国产业经济信息网京ICP备11041399号-2京公网安备11010502035964