数据同步

来源:1-2 课程目录

慕粉1500111685

2021-11-15

true 10.1.12.71 9000 10.1.12.74 9000 true 10.1.12.72 9000 10.1.12.77 9000

采用这样的部署方式,创建本地表和分布式表如下:
CREATE TABLE track_local on cluster mycluster (
terminalPhone String,
insertTime DateTime64,
bz String
) ENGINE = ReplicatedMergeTree(’/clickhouse/tables/{layer}-{shard}/track_local’, ‘{replica}’)
PRIMARY KEY (terminalPhone, insertTime) ORDER BY (terminalPhone, insertTime)
PARTITION BY toYYYYMM(insertTime)
SETTINGS index_granularity = 8192;

CREATE TABLE track_distributed on cluster mycluster as track_local ENGINE = Distributed(mycluster, default, track_local, rand());

今天服务器有断电过一次,重启服务后发现其中某个分区,app72的数据是一千万,而app77的数据是不到九百万,正常应该是两边数据是一直的,但现在不一致,该如何执行让两边的数据一致,不然使用分布式表track_distributed 查询时,查询结果都是不太一样,有两个,相差的数据就是一千万 减 九百万,这种情况应该如何处理?
谢谢!

写回答

1回答

Michael_PK

2021-11-16

这个我没有遇到过。

解决思路:把数据在另外一个表中重跑一下

0
0

Flink+ClickHouse 玩转企业级实时大数据开发

已经在做大数据,Flink助力轻松提薪;尚未入行,让你弯道超车

1000 学习 · 225 问题

查看课程