打通数据治理全链路,火山引擎DataLeap数据治理平台公有云版本正式发布

发布时间 2023-08-01 11:33:54作者: 字节跳动数据平台
更多技术交流、求职机会,欢迎关注字节跳动数据平台微信公众号,回复【1】进入官方交流群
 
近日,火山引擎DataLeap正式对外发布数据治理平台公有云版。DataLeap是火山引擎大数据研发治理套件,随着其子套件数据治理平台与CDH引擎底座成功适配,火山引擎决定通过公有云,进一步对外开放从规划、诊断到经验沉淀的数据治理全链路方案,帮助更多的企业实现数据治理高效率、标准化。
 
数据治理,简单来说就是对数据资产进行管理和控制,以确保高效的数据利用。海量数据为企业带来了价值,同时也带动了各类数据治理需求的井喷,作为数据标准化的基石,逐渐受到越来越多企业的重视。
 
基于丰富的业务场景与多年实践经验,字节跳动内部数据治理经历了多次优化演进,从起初简单解决治理痛点,优先稳定建设;到进一步评估数据质量,关注数据安全;再到重视成本优化,减轻团队负载压力,最终沉淀为规划式+响应式的特色分布式治理模式,并通过火山引擎DataLeap数据治理平台向外部企业输出。
 
据了解,火山引擎DataLeap数据治理平台公有云版致力于更加开放,贴合业务实践的一站式数据治理产品解决方案,从治理规划、数据质量、复盘管理、SLA治理、数据安全、资源优化、告警归因等多功能打通数据治理全链路,优势亮点:
 
  • 业务影响小,灵活自治:在规范上足够灵活,业务人员可在不同阶段指定治理内容,对齐治理标准。
  • 治理效率高,快速沉淀经验:做到数据治理规则化、策略化、自动化进行。
  • 低门槛与算法推荐:门槛低上手快,业务人员可利用算法推荐进行数据治理分析与诊断。
  • 适配性强,功能覆盖全链路:支持治理全流程,且各模块可独立使用,按需组合,满足不同场景下的治理需求。
 
DataLeap数据治理平台个人工作台功能
 
火山引擎DataLeap数据治理平台架构体系共分为三层。第一层是治理场景,包括数据质量安全、资源优化、报警、企业复盘管理等一系列垂直场景;第二层是治理门户,包括工作台、治理全景、规划、诊断、复盘等全流程治理环节;最底层包含从数据采集、传输、存储、处理、共享到销毁的数据全生命周期流程。
 
DataLeap数据治理体系是自上而下贯穿整个组织架构的完整链条,企业可通过持续的数据评估、指导和监督,确保富有成效且高效的数据利用,促进多部门协作和决策,为实际业务创造价值。
火山引擎DataLeap数据治理平台产品体系
 
另外,在企业中,不同角色导致数据治理视角也有所不同,火山引擎DataLeap数据治理平台的高适配特点,也为团队中不同的分工站位提供了对应的治理能力,从产品角度做到成本有人控、资产有人治、任务有人保。
 
从数据管理者角度来看,依据健康分体系,可以直观地看到不同团队的治理程度,通过横向对比,了解团队的资源使用情况,评估是否需还有优化空间,建立起属于企业独有的治理指标;而数据执行者可以直接将治理策略落到产品中,即使对于人力不足的业务,也能做到主动、快速治理。
 
目前,火山引擎DataLeap数据治理平台由火山引擎开源大数据平台EMR提供底层引擎支持,未来将会陆续支持LAS、ByteHouse、Vestack等数据引擎使用,更多功能也正在完善上线中,敬请期待。
 
数据治理影响范围广,且复杂程度高,同时涉及到业务和技术的多个方面,更需要企业加大投入和长期建设。除了数据治理平台,火山引擎DataLeap还可以提供数据集成、开发、运维、资产等能力,帮助用户提升数据研发效率、降低管理成本,加速推动企业的数字化转型,目前已经应用于泛互联网、制造、新零售、汽车等领域。