2016年中国大数据分析【图】
2015-11-30 来源:
一、传统处理方法难以应付数据爆炸式增长
信息爆炸,海量数据单机难以处理。2013 年全球数据量达到 4.4EB,而到 2020 年,预计全球数据量将达到 44ZB。全球消费者拥有二十亿智能手机,而世界上 40%的人口已经上线。智能设备带来全方位全时段个人数据,极大扩展了数据来源和种类,导致数据特征维数变高,而新的数据资产大多是结构化和非结构化数据的组合。传统处理方法较适合低维数据问题,当输入高维数据时容易出现过拟合的现象,影响训练效果。所以需要更好的方法去分析现有的数据特色。
输入端收集的数据复杂多样,需先集成才能后续数据挖掘。只有将大数据进行全面分析过后,才能发现它更多价值。然而,大家忽略了这些数据的来源以及复杂程度等。应用系统越来越多,数据格式越来越复杂,如何将各种类型的数据进行整合是一个关键。一般认为在数据分析的整个过程中,数据清洗及准备基本要占 80%的时间。
平台化是企业数据集成的未来。为了打破数据孤岛,目前已经很多企业的 IT 部门分设专门“数据集成能力部门”,管理各种本地的、云中的、数据仓库等等的数据。平台化的数据集成业务则易于重复使用、重复部署。
2012~2018 年全球大数据市场规模
二、大数据市场进入平稳增长的阶段
2015 年我国互联网普及率为 50.3%,比上年增长 2 个百分点。随着信息技术的创新,互联网的普及,数据量会不断扩大。据数据,2015 年全球大数据市场规模将近 1500 亿人民币,同比增长 24.2%;我国大数据市场规模为 160 亿元,仅占全球总市场规模的 10.7%,但同比增长率为 65.3%,是全球增长率的 2.7 倍。预计 2018 年全球大数据市场规模将达到超过 2500 亿元,2015 至 2018 年的复合增长率为 21.8%。
相关报告:智研咨询发布的《2017-2022年中国大数据行业运营态势及未来前景预测报告》
标签: 大数据 大数据行业 互联网 企业 数据分析 问题 信息技术 行业 中国大数据
版权申明:本站文章部分自网络,如有侵权,请联系:west999com@outlook.com
特别注意:本站所有转载文章言论不代表本站观点!
本站所提供的图片等素材,版权归原作者所有,如需使用,请与原作者联系。