千锋教育-做有情怀、有良心、有品质的职业教育机构

当前位置:首页  >  关于学院  >  技术干货  >  大数据技术干货  >  正文

如何保证数据质量(数仓)?

来源:千锋教育
发布时间:2022-08-31 17:19:00
分享

如何保证数据质量(数仓)

  数据质量:指我们数据加工、转换、计算等整个流程中的数据正确性,主要体现在ODS层和ADS层急需要数据质量,ODS主要判断ODS中的数据和业务库中的数据是否一致(条数),ADS层主要是看最终指标是否正确,也即入口和出口一定把质量监控好。

  1、大公司就可以说是公司自研的数据质量系统来保障数据质量,保证ODS同步数据是否多少、可以配置ODS层数据量为上游数据的百分比、可以配置告警。如:业务库订单表今天3000万条,但是采集到ODS层2000万条,配置告警规则为业务库orders/ods层orders=100%,这个时候肯定就要触发告警,因为订单涉及到钱,一条数据都不能丢。行为日志可以丢一些,自行根据需求设置即可。

  2、小公司,就是将1步骤中的实现过程自己实现,比如第一个版本使用Shell脚本自己实现ODS层和ADS层数据质量监控的;第二版本自己写的web项目来对数据质量监控,主要实现数据条数、同环比指标的一些监控。或者使用开源的框架:Griffin或DolphinScheduler 3.0就有数据质量功能了。

  更多关于“大数据培训”的问题,欢迎咨询千锋教育在线名师。千锋教育多年办学,课程大纲紧跟企业需求,更科学更严谨,每年培养泛IT人才近2万人。不论你是零基础还是想提升,都可以找到适合的班型,千锋教育随时欢迎你来试听。

声明:本站稿件版权均属千锋教育所有,未经许可不得擅自转载。

相关推荐

  • kafka集群搭建详细步骤 搭建Kafka集群涉及以下步骤:1.**安装和配置Java**:确保每台服务器都安装了适当版本的Java,并设置了正确的环境变量。2.**下载和解压Kafka**:从官方网站下载Kafka的二进制发行
  • zookeeper安装配置为什么报错? 安装和配置ZooKeeper可能会出现各种错误。以下是一些常见的错误和对应的解决方法:1.**连接错误**:在配置ZooKeeper集群时,可能会出现连接错误,例如连接超时、连接被拒绝等。这通常是由于
  • zookeeper搭建集群 要搭建ZooKeeper集群,你需要按照以下步骤进行操作:1.下载和安装ZooKeeper:从ApacheZooKeeper的官方网站下载ZooKeeper的二进制发行版,并根据操作系统的要求进行安装
  • kafka怎么使用 Kafka是一种高吞吐量、可扩展的分布式消息队列系统,常用于构建实时流数据处理和事件驱动的应用程序。下面是使用Kafka的基本步骤:1.安装和配置Kafka:-下载Kafka:访问ApacheKafk
  • jointplot()函数的用法是什么? jointplot() 是 Seaborn 数据可视化库中的一个函数,用于绘制两个变量之间的二维关系,通常是散点图或密度图,同时绘制单变量的直方图或密度图。
  • highcharts和echarts的区别 功能:两个库都提供了丰富的图表类型和交互功能,但是 Highcharts在某些方面比Echarts 更强大,比如地图类型和导出功能。性能:Echarts的渲染速度比 Highcharts 更快,因为它使用了Canvas来绘制图表。