“5G+”时代需要的数据治理工作

2019-08-08    来源:raincent

容器云强势上线!快速搭建集群,上万Linux镜像随意使用

前言

5G 可以实现万物互联,于是互联网大量的数据将来自“物”而不是“人”,而万物互联不是简单地实现了大量数据的自动采集,而是大量的“物” 甚至是“人”的行为不再是传统意义上等候具体某个人的发号司令和安排,而是真正被数据所驱动, 万物互联和数据驱动可以看成“5G+”时代的一体两面,没有数据驱动也就没有真正意义上的万物互联 ,然而,数据驱动并不是5G才有的,只是今天更加全面和深入而已 。

一 数据驱动与5G发展

“数据驱动”这个概念最早应该是出现在上世纪九十年代,当时诞生的商业智能的概念是通过数据分析和价值发现改善客户、产品、基础设施、盈利方式等业务核心环节的活动安排,从而提升效率和效益,创造价值,而 在“数据驱动”这个概念提出前的信息技术是“功能驱动”和“流程驱动” 的,早期的计算机程序受限于硬件性能和存储空间,不太可能处理大规模的数据,存储数据的成本也很高,所以数据依附在算法的结构里面,和公园门票一样,用过就丢弃了,当然也发挥不了今天的价值。

 

新知图谱, “5G+”时代需要的数据治理工作

 

图1 数据地位直接决定了企业信息化生产力水平

即使时间倒退到30多年前,随着关系型数据库(RMDB)技术被越来越广泛使用,各种信息系统沉淀下来可以被重复利用的数据资源也越来越多,可以用数据来做的文章也越来越大,数据的重要性和价值日益凸显,1996年的时候《Being Digital(数字化生存)》的作者Negroponte(尼葛洛庞帝)就提出数字化生活的概念,而20多年以后的今天,我们已经进入了数字化的生活,移动互联网、物联网、手机、各种社交媒体、电子支付等各种数字化技术把我们的生活完全连接到了云端,连接到了网络。每一个消费者通过手机和设备,成为了一个巨大的数字化网络的一个节点,每时每刻,我们从云端获取各种信息,各种状态,浏览各种商品,从而实时的决定我们的决策和行动,“数据驱动”成为日常生活。

过去,很多行业知识、数据、信息、方法等都是封闭的,而 数字化时代首先的表现是信息透明,信息透明给这个社会带来的改变是巨大的 ,它从根本上打破了传统的物理世界的各种信息壁垒,极大的冲击了传统行业和社会形态。在互联网上每一个人可以搜索到各种各样他需要的数据,并从中获得他需要的各种各样的信息。

今天,越来越多的企业已经把业务搬到网上了,这些业务活动都需要数据才能驱动和运作, 数据质量不仅仅关乎企业组织和机构内的业务效率和效益,更关乎到客户和合作伙伴的满意度和配合度 ,而事实上,由于大量关于人财物等核心资源的数据质量不高,很多企业开展网上业务背后也还是靠人力服务(People Service)来驱动的,这样 积累下来的数据如何和企业内部信息系统的数据有效共享和融合又成为新的难题 。

随着5G的到来,随着数据传输速度的加快和终端设备的增多,直接产生数据量的增长,海量的联网终端意味着海量的数据。5G只是底层通讯技术,但当传播能力改变后,一切都会随万物互联而改变,在更多的联接而产生数据爆炸的时代,处理大数据成为各类型政企事业单位组织必不可少的能力,当数据在组织生活中要发挥的作用越来越大,由于要快速处理的各种海量数据的增加,复杂度随之增加,管理和控制的难度越来越大,如果不加以有效治理,组织将面对越来越错综复杂和事关重大的数据问题。

 

新知图谱, “5G+”时代需要的数据治理工作

 

图2数字经济正洗刷企业小数据环境

数字经济中数据被认为是推动企业增长和商业创新引擎的燃料,数据无疑被组织认定且拥有的资产之一,但是由于其海量数据的增加,复杂度随之增加,管理和控制的难度越来越大,数据治理已提升为企业战略优先事项。

二 国内外典型数据管理框架体系

近些年来,随着大数据在各个行业领域应用的不断深入,数据作为基础性战略资源的地位日益凸显,数据标准化、数据确权、数据质量、数据安全、隐私保护、数据流通管控、数据共享开放这些问题越来越受到国家、行业、企业各个层面的高度关注,这样一来,数据治理的概念就越来越多受到了关注,成为目前大数据产业生态系统中的新热点。 在2019年4月召开的全国大数据标准化工作会议暨全国信标委大数据标准工作组第六次全会上,中科院院士梅宏呼吁,大数据治理问题必须提上日程。

2.1、国际DAMA数据管理知识框架体系

在上世纪80年代,随着数据随机存储和数据库技术应用,产业界首次提出了数据管理的概念,这就是数据治理最早的起源。2009年,国际数据管理协会(DAMA)发布了数据管理知识体系DMBOK1.0,提出DAMA数据管理理论框架模型,成为了目前行业最权威的数据管理理论模型,DAMA数据管理模型包括9个职能,分别是数据架构管理、数据开发、数据操作管理、数据安全管理、参考数据和主数据管理、数据仓库和商务智能管理、文档和内容管理、元数据管理和数据质量管理。2017年,DAMA新发布的DBMOK2.0知识领域中又将该模型扩展为10个活动职能。

2.2、DGI数据管控框架模型

在2012年,另一个行业组织数据管控协会(DGI,The Data Governance Institute)提出了DGI数据管控框架模型。2014年,软件工程研究所(SEI)基于软件能力成熟度集成模型(CMMI),提出数据能力成熟度模型(DMM)。2015年,一个主要面向金融保险行业数据管理的公益性组织企业数据管理协会(EDM Council),提出数据管理能力评价模型(DCAM),另外还有像Gartner提出的企业信息能力成熟度模型(the EIM Maturity Model)、IBM企业数据管理能力成熟度模型以及一些咨询公司如毕马威、普华永道等发布的细分行业数据管理体系架构等。

2.3、《数据管理能力成熟度评估模型》

在我国,近年来,国内各行业大型企业也纷纷发起企业内部数据治理项目,制定数据治理规范,成立专业的数据管理实体团队来开展企业数据治理工作。特别是在2018年4月,国家大数据标准化工作组正式发布了国家标准《数据管理能力成熟度评估模型GB/T 36073-2018》(简称《DCMM模型》),并将在2018年10月1日起正式实施。DCMM定义了数据能力成熟度评价的八大能力域:数据战略、数据治理、数据架构、数据标准、数据质量、数据安全、数据应用、数据生命周期管理,这8个能力域又包括28个能力项。

 

新知图谱, “5G+”时代需要的数据治理工作

 

图3 数据管理能力成熟度评估模型-能力域与能力项

三 数据治理相关认识误区及5G环境其内涵变化

通常 数据治理被认为是获得高质量数据的核心控制规程,用于管理、使用、改进和保护企业数据加工过程中数据质量 。许多企业通过学习、培训和借鉴经验,开展自身的数据管理实践,通过寻找行业基准和通用框架建立实施方法论。按传统理解,数据治理工作的推进者通常为企业的信息管理者和信息技术工作者,他们关注需要跨职能、跨流程、跨功能边界的标准化,考虑信息生命周期中数据质量、数据安全的需求,这仿佛只是技术层面的工作。

但笔者实践中发现, 如果我们仅仅把数据治理工作看成技术层面的工作,在实际工作中就会发现很多数据治理的要求难以贯彻执行 。以银行为例,大量的数据质量问题的源头是技术解决不了的,比如曾几何时,很多银行的柜员都习惯为了节约时间,潦草地录入客户的身份和联系信息,这些情况不但我等银行信息科技部门的人无能为力,行管理层对网点三令五申也收效甚微,笔者在过往培训工作中和某国有大银行的学员沟通曾亲耳声闻,该行为了解决数亿户储蓄账户中身份证号字段的历史存量数据质量问题,后期不得不耗费数十亿的业务动员和奖励费来逐户修正,可见其影响面早已经超越了技术层面。

特别是在一些我国还普遍存在信息化程度偏低的单位中,有一个更为严重的认识误区,这些单位中的人可能认为,我们单位自己并没有运行什么信息系统呢,也没有管理什么数据资源,就没有必要做这么复杂的数据管理能力成熟度评价工作了, 这个认识误区恰恰折射出还有相当数量的人对于组织的数字化转型并无紧迫感, 还不明白数字化生存对于组织的重要性。

当5G彻底实现了万物互联以后,物理世界的一切都会被数字化,数字化技术把一切都连接起来,原来传统世界的地理位置,时间跨度,商业模式,职业,岗位,技能,一切的被连接成一张立体的网,都可以通过一个点寻找到另外一个点,原来的行业边界,组织边界,职位边界,角色边界,都被数字化所链接,所打破。所以,数字化转型是区别于传统的组织形式、沟通形式、技术手段所产生的变化本身,数字化将组织的所有一切活动和资源都必然转化成数据,组织建立从数据出发的管理体系, 用数据驱动业务的运营、战略的制定和创新的产生,是任何一个组织在未来数字化生存(Being Digital)最核心的工作 。

今天我们讲数字化转型也好,讲数据驱动也罢,其实更加强调任何一个组织的运营模式在5G时代都将发生根本性的变化,所有的变化都离不开“数据基因”,否则就会因水土不服而无法生存。 从这个层面来看到“数据体检”,不能再理解为是仅仅从数据技术的层面,对组织“拥有”的数据资源做检查和评价 ,而是衡量组织在日益高度数字化的世界里面体质还“健康”吗?

四 5G 时代对组织数字化转型的要求

自然生命的身体拥有强大的自我调节能力和适应力,组织生命明显没有这种自我适应力,所以如果组织希望能在数字化的世界里生存下去, 不断地通过“数据体检”来培养“数据基因”是必需的 。组织为什么要做数据体检呢?结合5G时代对组织数字化转型的要求,这里笔者将从这几个方面给出具体的解释:

1)首先还是组织运营管理的思维问题.

据笔者所知,任何一位学习MBA的同学,《组织行为学》都是第一门基础课,对于任何一个组织,必然是以组织成员共同努力完成一些组织任务而成的,所谓的管理,我认为本质上就是组织各项要素(人财物等等)形成一致行动,实现一定组织目标的过程,在这个过程中,最关键的就是决策了。管理大师赫伯特·西蒙(Herbert A.Simon)就明确指出过:“管理就是决策”,而决策就要知己知彼了,决策所依赖的信息环境对于决策的正确与否和质量高下有非常大的干系, 现代的组织内部关系非常复杂,靠人与人之间口耳相传,信息传递和传播不完整不对称则是常态了 ,这种情况下,管理者对于组织的情况要及时了解全面掌握是非常困难的,所以觉得依据个人经验和意志就成为很多管理者的思维习惯了。曾经就非常形象地描绘过这样的三拍干部,做决定拍脑袋,对上级拍胸脯,搞不掂拍屁股,可以说,这种任性决策的试错后果就让组织来埋单了。可以说,经过第三次工业革命以来的四十多年时间,没有数据支撑的组织决策是不合时宜的已经是全球共识,让数据说话,说起来简单,但到了很多组织当权人手上,要不折不扣地执行就很难了, 归根到底还是思想认识的问题。

2)其次是当前组织关系重构的问题

2016 年7月27日,中共中央办公厅、国务院办公厅印发《国家信息化发展战略纲要》明确指出,当前人类社会“正在经历信息革命”,“没有信息化就没有现代化”,要“以信息化驱动现代化”。 而当前以互联网为代表的信息革命,改变了人们思考社会的知识范畴、治理社会的行为方式和模式、塑造着人类社会生活新的空间和秩序。“数字化”在当下已不再仅仅是一个概念,而是现实世界的真实存在,数字化、网络化动摇了以固定空间、相对集权为基础的国家或组织的根基 ,进而越来越成为人们社会生活的一种常态,以至于人、人性本身以及人与人之间的社会关系都在经历数字化洗礼、网络化重塑、分权化再造,乃至连带我们的政府形态和社会治理模式也将步入新的历史阶段。笔者之前已经多次论证,今天的大数据资源,不仅仅是生产力要素,还是新生产关系的温床和载体,大数据已经事实上取代人成为生产力中最革命、最活跃的因素,从全社会角度,是大数据革命,在组织角度,就是数字化转型,数字化转型对组织来说是脱胎换骨,那自然要更换组织基因,所有组织数字化转型的出发点,都离不开“数据基因”的形成和依此对组织的彻底改造,基因是遗传信息,作为遗传信息,基因必须是全息的,可以指导所有的组织结构和组织行为,这是今天做组织数据管理工作的本质。

3)最后很自然就涉及到了数据治理

就是如何解决今天组织所面对的林林总总数据问题,这些数据问题已经越来越成为组织生存和发展的绊脚石了,不把这些数据问题解决掉,组织在新时代的数字化转型就无法功成,可这些问题的病根恰恰是出现在组织缺乏“数据基因”造成的, 本质上是组织没有“数据基因”已经适应不了“5G+”时代新环境的生存需要了 。现在很多组织也或主动或被动地、八仙过海各显神通地做了不少信息化工作,满足了一些急迫的数据应用需求,可是那种头疼医头脚痛医脚的数据管理方式,已经不能治组织的“基因病”了,先全面检查和把脉一下组织数据基因的问题,才能有效地避免组织数字化转型的迷茫和风险。

所以,从这三方面分析我们可以看到, 数据体检对于当下所有的组织都是必需的 ,这个和对人的健康体检有类似的地方,组织在“5G+”时代的数字化生存当然需要有健康的数据体格,评价一下现在组织的数据体格够不够健康,当然要全面检查一下,而不太一样的地方是,人体基因是稳定的,健康也有明确的参考标准,而组织的数据基因还要不断补充,数据体检更多是识别组织的数据管理工作的薄弱环节,明确组织数据管理工作的提升和发展方向,给数据治理工作提供基础和输入。

五 5G 时代数据治理工作不能仅停留在技术层面

从这个层面,我们可以比较直观地理解数据体检和数据治理的关系,数据体检是客观理解和评价组织数据体格现状,在这个基础上明确健身方向,而数据治理就是具体的健身行动了。很多人说,我去健身也不见得非要去医院做全面体检啊,这个刚才已经谈到了,人体的基因对于人的生命来说是稳定的,只要不违反生理常识的健康锻炼也不需要像治病一样的医疗检测服务,而组织现在所处的数据环境是非常VUCA(易变、不确定、复杂、模糊)的,数据治理要解决的问题很复杂,对组织数据体格的治疗和调理, 要治心(文化与基因)、治脑(决策与管控)、治手(管理与控制)、治脚(实施与执行)多管齐下 ,这是非常复杂的系统性工程,是需要持续用力久久为功的,任何大而化之、急功近利都无法真正解决结构性的组织数据问题。而数据体检工作就不仅仅是评价现状这么简单,还要 以评促学、以评促用、以评促通、以评促创 ,归根到底还是为了 推动组织的数字化转型发挥“数据基因”作用 ,这样才能为后续的全面数据治理工作奠定好组织基础。

当然, 仅仅做数据管理成熟度评价也并不能真正地解决组织各种数据问题 , 关键还是要组织转化成一系列行之有效的行动 ,今天如果我们仅仅还是停留在技术的层面来理解数据治理工作毫无疑问是片面和错误的,在“5G+”时代,数据的采集、加工和应用随时随地无所不在,我们每个人都是数据的生产者和消费者,数据包含了一切的事实,数据也包含着一切的本质, 数据治理本质上就是如何让人的思想、决策与行为所形成的数据更加符合客观实际的要求 ,这毫无疑问不是一个仅仅停留在技术层面能解决的问题。

更进一步,“5G+”时代是一个让人工智能变成自来水供应的时代, 大数据是人工智能技术研发、训练的关键,是人工智能长期发展的重要保障 。只有当人工智能系统能够获取更为准确、及时、一致的高质量数据,才能提供更有效、有用、精准性高的智能化服务。数据治理是人工智能的基础,“5G+”时代数据治理的主要目的之一很可能是为人工智能提供高质量的大数据“燃料”,而人工智能本身就是燃烧大数据而炼金的一种商业模式,如果说人工智能是机智过人的技术活,那么数据治理更强调的是人类社会中每个组织和个人都要修炼内功,才能确保我们给人工智能所灌输的是能造福人类社会的正确信念。

结束语

从更深层的考虑, 治理数据是组织数字化转型必修的手段,而数据资源的良好治理,归根到底还是依靠组织各方面数字化能力的成长,这样才能从根本上得到满足组织发展需要的高质量数据资源 ,所以,数据治理工作的目的不应该是数据,治理数据是不够的,不断修炼和提升我们组织自己的数据能力才是根本目的

治理数据是“假的”,修炼我们自己的能力才是真的,借“假”修真方得始终。( 鸣谢:在编写过程,感谢蔡春久先生给予良好的建议 )

作者:张靖笙

标签: 数据驱动 5G

版权申明:本站文章部分自网络,如有侵权,请联系:west999com@outlook.com
特别注意:本站所有转载文章言论不代表本站观点!
本站所提供的图片等素材,版权归原作者所有,如需使用,请与原作者联系。

上一篇:百度内部学习PPT:数据分析的道与术!

下一篇:大型数据库支持面部识别抓取,隐私何处安放?