跳至主要內容
数据流转架构

数据流转架构

技术选型

数据同步

常见数据同步软件:DataX、Sqoop、Maxwell、Canal

框架 DataX/Sqoop Maxwell/Canal
对数据库要求 原理是基于查询,若想通过select查询获取新增及变化数据,就要求数据表中存在create_time、update_time等字段,然后根据这些字段获取变更数据 要求数据库记录变更记录,如:MySQL要开启binlog
数据等中间状态 由于是离线批量同步,故若一条数据在一天中变化多次,该方案只能获取最后一个状态,中间状态无法获取。 由于是实时获取所有的数据变更操作,所以可以获取变更数据中所有中间状态

leo z小于 1 分钟后端大数据分布式架构