千锋教育-做有情怀、有良心、有品质的职业教育机构
数据质量:指我们数据加工、转换、计算等整个流程中的数据正确性,主要体现在ODS层和ADS层急需要数据质量,ODS主要判断ODS中的数据和业务库中的数据是否一致(条数),ADS层主要是看最终指标是否正确,也即入口和出口一定把质量监控好。
1、大公司就可以说是公司自研的数据质量系统来保障数据质量,保证ODS同步数据是否多少、可以配置ODS层数据量为上游数据的百分比、可以配置告警。如:业务库订单表今天3000万条,但是采集到ODS层2000万条,配置告警规则为业务库orders/ods层orders=100%,这个时候肯定就要触发告警,因为订单涉及到钱,一条数据都不能丢。行为日志可以丢一些,自行根据需求设置即可。
2、小公司,就是将1步骤中的实现过程自己实现,比如第一个版本使用Shell脚本自己实现ODS层和ADS层数据质量监控的;第二版本自己写的web项目来对数据质量监控,主要实现数据条数、同环比指标的一些监控。或者使用开源的框架:Griffin或DolphinScheduler 3.0就有数据质量功能了。
更多关于“大数据培训”的问题,欢迎咨询千锋教育在线名师。千锋教育多年办学,课程大纲紧跟企业需求,更科学更严谨,每年培养泛IT人才近2万人。不论你是零基础还是想提升,都可以找到适合的班型,千锋教育随时欢迎你来试听。
相关推荐