超90%的中国企业困于数据孤岛,星环科技要为企业数字化转型赋予“超能力”
企业要进行数字化转型有多难? “不转型等死,如果转型不好就是找死。”国家信息中心信息化和产业发展部主任单志广在参加某活动时如是说道。 诚然,随着大数据、云计算以及人工智能技术的普遍应用,数据可谓是当下最重要且最具价值的资产,企业通过挖掘与分析数据,可提高其竞争力,预测市场趋势,做出更具针对性的决策。因此,对企业而言,为谋求高质量发展,保持和提升市场竞争力,数字化转型升级,既是战略性选择,更是企业精细化运营的必经之路。 然而,在实际转型过程中,数据孤岛问题却成为阻碍企业发展的重要因素。 在奔跑的火车上换引擎 什么是数据孤岛?即企业发展到一定阶段,出现多个事业部,每个事业部都有各自数据,事业部之间的数据往往都各自存储,各自定义,会存在多个数据中心,甚至跨海内外的数据中心,每个事数据中心就像一个个孤岛一样无法(或者极其困难)和企业内部的其他数据进行连接互动。 根据《2019中国企业数字化转型及数据应用调研报告》显示,中国已开展数字化转型的企业中,普遍面临系统化建设滞后、数据管理水平及数据质量不高的困境。有超过80%的企业其数据以非结构化为主,超过90%的企业内部存在数据孤岛问题。 因此,如何对海量的数据进行统一的分析处理,提升企业的数据管理水平及数据质量,成为当前企业面临的重大考验。 而星环科技要做的,正是帮助企业解决这一痛点。 公开资料显示,星环科技成立于2013年,致力于用产品来解决大数据的4V挑战,即数据量大、数据种类多、数据实时性高、要从数据中发掘价值。成立至今,公司已完成7轮融资,投资方不乏深创投、中金公司、启明创投等知名机构。 5月15日,星环科技召开线上发布会,全面升级了ABC(人工智能、大数据、云计算)三条产品线,发布了包括多模异构数据平台、联邦云,以及AIoT、全栈知识图谱、反欺诈三大解决方案在内的一系列重磅产品。 打破数据孤岛,实现四大“统一” 目前,各种大数据技术应用越来越广泛,特别是对于一些单一的典型场景,业界有了不少知名的解决方案,如结构化数据使用Hive;动态列模型使用Bigtable、Hbase;文档处理使用MogoDB;图数据使用Neo4j;搜索引擎ElasticSearch等等。 但是这些产品都是孤立的,只能解决一类问题,而在实际应用中,用户的使用场景日趋复杂,处理多模型的需求日趋迫切。在处理多模型的需求时,用户不得不采用多工具组合的混合方法,但这种混合方法的运维过于复杂,必须要维护多种数据库来满足不同模型的需求。因此,用户迫切需要一个统一的平台解决日益多样灵活的各类需求。 TDH7.0作为一个多模型的数据处理平台,可以提供统一的数据操作/查询语言 SQL、统一的数据计算引擎、统一的分布式存储管理系统、统一的资源管理框架,满足利用一个多模异构平台,处理多种数据的需求。 具体来看,产品从上而下划分为五个层次: 1、SQL层:开发了统一的SQL引擎,兼容各种不同的SQL方言; 2、计算层:开发了统一的计算引擎,进行统一的计算任务优化和分发; 3、存储模型层: TDH一个平台支持七种不同的存储模型,适用于不同的应用场景,包括:图存储 Graph Storage、文档存储 Document Storage、全文检索 Full-text Search、键值存储 Key-Value Storage、行列混合存储 Row-Columnar Storage 、时空地理存储 Sequential Geospatial Storage、非结构化对象存储 Unstructured Object Storage。 4、存储管理层:开发了统一的存储管理引擎,提供数据块分布管理、数据多副本一致性管理、文件服务管理等功能; 5、资源调度层:开发了统一的资源调度框架,通过容器化编排,统一调度计算、存储、网络资源。 大数据“云”化 在5月15日的发布会上,星环科技数据云平台Transwarp Data Cloud(TDC)还发布了新特性“联邦云”,致力于满足企业数字化转型中的各类诉求,给企业提供平台化、生态化的数字化转型解决方案,可以将客户横跨多个云平台、多个数据中心上的数据进行打通和统一管理。 乍看之下,“联邦云”的概念似乎与混合云类似,但实质却有不同。 “混合云是由公有云厂商提出,主要是用一套软件解决公有云和私有云互通的问题。实现的主要工作就是业务遇到高并发或者业务要做高可用、做业务级灾备时,可以很方便地从公有云弹性扩到私有云上。而星环科技提出的联邦云,更多的是一个数据PaaS的概念,它有混合云的业务场景,但更多的是针对有大量私有中心的企业客户进行更好地数据统一的使用存储的一个业务场景。”在接受媒体采访时,星环科技方面如是说道。 据了解,TDC主要实现了五个层面的联邦化: 1、云资源的联邦化:把IaaS层的计算、存储、网络互通,可以调用更多的计算资源进行弹性扩张。 2、数据的联邦化:在每一个数据中心都建立数据资产目录,可以进行数据共享交换。 3、计算的联邦化:能够把一个统计需求,分散到多个数据中心上面去进行运算,再把结果进行汇总,称之为联邦计算。可以同时去访问多个数据中心的数据,也能同时利用多个数据中心的计算资源。 4、联邦学习:把机器学习的一个模型分发到多个数据中心上面进行分散计算,利用收集回来的特征进行模型训练,不断改进模型。这种方式一方面可以利用各个数据中心的数据和计算资源,另外一方面也保护了数据隐私,可以保证原有数据不从某个数据中心进入到另外一个数据中心。 5、应用的联邦化:应用程序能够在多个数据中心之间统一管理,在一个数据中心部署的应用能够非常顺滑地迁移到另外一个数据中心,多个数据中心也可以形成一个统一的应用市场,所有的应用都可以被统一管理。 总体来说, TDC就是由一个基于容器的数据中心云操作系统,以及三大PaaS平台服务(Database PaaS、Analytics PaaS和Application PaaS)的组成,可支持企业级一站式数据开发,可集成BI 和AI能力,可以应用为中心,提供应用全生命周期管理能力。 (编辑:应用网_阳江站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |