加入收藏 | 设为首页 | 会员中心 | 我要投稿 应用网_阳江站长网 (https://www.0662zz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 创业 > 模式 > 正文

建设数据中台?先想想企业有没有这个底子!

发布时间:2020-08-05 09:15:18 所属栏目:模式 来源:it168网站
导读:最近数据中台很火,接触的很多企业都在提这个东西。然而,很多连数据基础都没有、仍然处在数据孤岛阶段的企业,上来就说我今年要做数据中台项目,这实际上是因为大家都在追热点,而没有真正搞明白这个名词的含义。 那么,数据中台到底是什么?它和数据仓库

最近数据中台很火,接触的很多企业都在提这个东西。然而,很多连数据基础都没有、仍然处在数据孤岛阶段的企业,上来就说我今年要做数据中台项目,这实际上是因为大家都在追热点,而没有真正搞明白这个名词的含义。

那么,数据中台到底是什么?它和数据仓库、大数据平台又有什么区别呢?

首先,国内的数据中台兴起,大多是因为阿里巴巴的马老师提出的”大中台、小前台”的口号。所以,我们先来看看阿里对数据中台的定义。

建设数据中台?先想想企业有没有这个底子!

数据中台是什么

数据中台是指通过数据技术,对海量数据进行采集、计算、存储、加工,同时统一标准和口径。数据中台把数据统一之后,会形成标准数据,再进行存储,形成大数据资产层,进而为客户提供高效服务。这些服务跟企业的业务有较强的关联性,是这个企业独有的且能复用的,它是企业业务和数据的沉淀,其不仅能降低重复建设、减少烟囱式协作的成本,也是差异化竞争优势所在。

广义的数据中台包括了数据技术,比如对海量数据进行采集、计算、存储、加工的一系列技术集合,今天谈到的数据中台包括数据模型,算法服务,数据产品,数据管理等等,和企业的业务有较强的关联性,是企业独有的且能复用的,比如企业自建的2000个基础模型,300个融合模型,5万个标签。它是企业业务和数据的沉淀,其不仅能降低重复建设,减少烟囱式协作的成本,也是差异化竞争优势所在。

数据中台的价值

  1、数据复用

浙江移动已经将2000个基础模型作为所有数据服务开发的基础,这些基础模型做到了“书同文,车同轨”,无论应用的 数据模型有多复杂,总是能溯源到2000张基础表,这奠定了数据核对和认知的基础,最大程度的避免了“重复数据抽取和维护带来的成本浪费。曾经企业的数据抽取就有多份,报表一份,数据仓库一份,地市集市一份,无论是抽取压力、维护难度及数据一致性要求都很高。同时,统一的基础模型将相关业务领域的数据做了很好的汇聚,解决了数据互通的诉求,这点的意义巨大,谁都知道数据1+1>2的意思。

2、沉淀业务模型

在企业内,无论是专题、报表或取数,当前基本是烟囱式数据生产模式或者是项目制建设方式,无法形成标准化统一业务模型,无法沉淀和共享也就无法迭代生长,从而造成模型不能真正成为可重用的组件,无法支撑数据分析的快速响应和创新。只有在迭代生长中的业务模型才能从最初的单一字段,逐渐完善形成为企业最为宝贵的统一模型资产和统一数据资产。

以报表为例,企业报表成千上万的原因往往也是没有沉淀造成的,针对一个业务报表,由于不同的业务人员提出的角度不同,会幻化出成百上千的报表,如果有报表中台的概念,就可以提出一些基准报表的原则,比如一个业务一张报表,已经有的业务报表只允许修改而不允许新增,自然老报表就会由于新的需求而不断完善,从而能演化成企业的基础报表目录,否则就是一堆报表的堆砌,后续的数据一致性问题层出不穷,管理成本急剧增加,人力投入越来越多,这样的事情在每个企业都在发生。

3、数据驱动业务创新

我们都知道,以往的业务决策,大多是凭经验拍脑袋的,现如今,数据的价值和重要性不言而喻。企业的管理者在做决策时,越来越想要先看数据。所以,好的数据基础,是决策和创新的加速器。而现在市场竞争如此激烈的大环境,不但需要企业做出正确的决策,效率和执行力也是关乎存亡的,数据中台即是数据创新效率的保障。研究过机器学习的都知道,没有好的规整数据,数据准备的过程极其冗长,这也是数据仓库模型的一个核心价值所在,比如运营商中要获取3个月的ARPU数据,如果没有融合模型的支撑,得自己从账单一层层汇总及关联,速度可想而知。在如今的互联网时代,企业都在全力谋求转型,转型的关键是要具备跟互联网公司一样的快速创新能力,大数据是其中一个核心驱动力,但拥有大数据还是不够的,数据中台的能力往往最终决定速度,拥有速度意味着试错成本很低,意味着可以再来一次。

4、数据中台孕育新型人才

原来新员工入职要获得成长,一是靠人带,二是找人问,三是自己登陆各种系统去看源代码、了解各系统底层数据结构,这样的学习比较支离破碎,其实很难了解全貌,无法知道什么东西对于企业是最重要的,获得的文档资料也往往也是过了时的。现在有了数据中台,很多成长问题就能解决,有了基础模型,新人可以系统的学习企业有哪些基本数据能力,O域数据的增加更是让其有更广阔的视野,有了融合模型,新人可以知道有哪些主题域,从主题域切入去全局的理解公司的业务概念,有了标签库,新人可以获得前人的所有智慧结晶,有了数据管理平台,新人能清晰的追溯数据、标签和应用的来龙去脉,所有的知识都是在线的,最新的,意味着新人的高起点。更为关键的是,数据中台让新人摆脱了在起步阶段对于导师的过渡依赖,能快速的融入团队,在前人的基础上进行创新。数据中台天然的统一,集成的特性,有可能让新人打破点线的束缚,快速构筑起自己的知识体系,成为企业数据领域的专家。

数据中台、数据仓库、大数据平台的关键区别是什么?

认可了数据中台的价值,我们自然是想要去快速搭建,然后真正去规划建设的时候,我们会发现,数据中台的建设和数据仓库、大数据平台是有重合的,这就需要我们充分理解三者的区别。

  数据中台

数据中台是企业级的逻辑概念,体现企业 D2V(Data to Value)的能力,为业务提供服务的主要方式是数据 API;数据中台距离业务更近,为业务提供速度更快的服务;数据中台可以建立在数据仓库和数据平台之上,是加速企业从数据到业务价值的过程的中间层。

  数据仓库

数据仓库是一个相对具体的功能概念,是存储和管理一个或多个主题数据的集合,为业务提供服务的方式主要是分析报表。数据仓库是为了支持管理决策分析,而数据中台则是将数据服务化之后提供给业务系统,不仅限于分析型场景,也适用于交易型场景;

数据仓库具有历史性,其中存储的数据大多是结构化数据,这些数据并非企业全量数据,而是根据需求针对性抽取的,因此数据仓库对于业务的价值是各种各样的报表,但这些报表又无法实时产生。数据仓库报表虽然能够提供部分业务价值,但不能直接影响业务。

大数据平台

大数据平台是在大数据基础上出现的融合了结构化和非结构化数据的数据基础平台,为业务提供服务的方式主要是直接提供数据集;

大数据平台的出现是为了解决数据仓库不能处理非结构化数据和报表开发周期长的问题,所以先撇开业务需求、把企业所有的数据都抽取出来放到一起,成为一个大的数据集,其中有结构化数据、非结构化数据等。

当业务方有需求的时候,再把他们需要的若干个小数据集单独提取出来,以数据集的形式提供给数据应用。

综上,我们会发现,数据中台是在数据仓库和大数据平台的基础上,将数据生产为为一个个数据 API 服务,以更高效的方式提供给业务,本质是一个构建在数据仓库之上的跨业务主题的业务系统。

(编辑:应用网_阳江站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

推荐文章
    热点阅读