可能原因一
由于全量数据迁移会并发执行 INSERT 操作,导致目标库的集合产生碎片,因此全量迁移完成后目标库的集合存储空间会比源库的集合存储空间大。
解决方案
您可以在迁移任务完成后,通过 vacuum
命令手动整理表碎片。
可能原因二
在迁移或同步任务中将备库作为源端。
在主库存在频繁的数据变动时,备库上的长连接将被断开,因此备库和数据库传输服务 DTS 的长连接会被断开。对于没有主键的表,在 DTS 和备库重新建立连接后会重新进行全表扫描,无主键的表也不会进行去重操作,从而导致数据重复、膨胀。
解决方案
在进行迁移或同步过程中,请勿使用备库作为源端。