synchronization
数据库同步
JDBC
默认情况下都是单线程,速度慢;
可优化为并行,但过大的并行会对数据源库造成压力;
Datax
对Oracle支持通过对splitPk进行sample查询后,根据网络限制计算得到的分片任务数,计算得各个任务的上下界作为where条件来并行
Seatunel
目前从源码看是不支持jdbc并行抽数
Spark
1 | def jdbc( |
Flink
使用NumericBetweenParametersProvider
设置步长和上下界
默认情况下都是单线程,速度慢;
可优化为并行,但过大的并行会对数据源库造成压力;
对Oracle支持通过对splitPk进行sample查询后,根据网络限制计算得到的分片任务数,计算得各个任务的上下界作为where条件来并行
目前从源码看是不支持jdbc并行抽数
1 | def jdbc( |
使用NumericBetweenParametersProvider
设置步长和上下界