沃梦达 / IT编程 / 数据库 / 正文

Redis全量同步和增量同步原理

主从第一次同步是全量同步:也就是说,当你主从节点连接建立后,需要执行一次全量同步,但如果slave重启后同步,此时slave重启后,slave节点和master节点的数据之间有落后,因此需要进行增量同步,感兴趣的同学可以参考阅读

全量同步

主从第一次同步是全量同步:也就是说,当你主从节点连接建立后,需要执行一次全量同步。那么Redis如何实现全量同步呢?

其实本质就是Master 给 slave 发送其保存的RDB文件。slave读取RDB文件恢复数据

 详细介绍:

IiBzcmM9

【第一步】slave与master建立连接后,master判断该slave 是否是第一次建立连接。那么该如何判断呢?

其实Master和slave都有一个Replication Id,简称replid,若id一致说明是已经建立过连接了,不需要进行全量同步,则需要进行增量同步。

【第二步】master 执行bgsave,生成RDB文件,同时在生成RDB的同时,也会产生一个baklog文件记录RDB期间的命令,然后将RDB文件发送给从节点,从节点加载RDB文件中的数据。至此全量同步已经完成。

【第三步】也就是后续master和slave在进行同步时候就是增量同步。则需要利用之前生成的baklog文件。

【总结全量同步】

  • slave节点先进行增量同步;
  • master节点判断replid,发现不一致,拒绝增量同步;
  • master将完整内存数据生成RDB,发送RDB到slave;
  • slave清空本地数据, 加载master的RDB;
  • master将RDB期间的命令记录在repl_baklog,并持续将lgo知道命令发送给slave;
  • slave执行接收到的命令,保持与master之间的同步。

增量同步

主从第一次同步是全量同步,但如果slave重启后同步,此时slave重启后,slave节点和master节点的数据之间有落后,因此需要进行增量同步。

IiBzcmM9

【过程】

master节点和slave节点中维护了一个环形数组(前文提到的repl_baklog)和一个指针为offset。

slave来申请增量同步,带着replid和offset,然后master根据获取offset之后的数据,将其发送给slave,slave进行同步。

  • 此时会出现一个问题,当slave下限太久时,master中存储的数据已经超过了这个repl_baklog的上线,因此就需要重新进行全量同步。

通过对Redis主从集群的同步介绍,可以从以下几个方面来优化Redis的主从集群

  • 在master中配置repl-diskless-sync yes 启用无磁盘负责,来避免全量同步时的磁盘IO。(应用场景:你的磁盘传输比较慢,但是你的网络带宽很大,网络状况极好。)
  • Redis单节点上内存占用不要太大。减少RDB文件的大小。
  • 适当的提高repl_baklog的大小,尽量slave恢复后做全量同步。
  • 限制一个master上的slave节点数量,可以采用主从链的形式。

IiBzcmM9

总结

IiBzcmM9

到此这篇关于Redis全量同步和增量同步原理的文章就介绍到这了,更多相关Redis全量和增量同步内容请搜索编程学习网以前的文章希望大家以后多多支持编程学习网!

本文标题为:Redis全量同步和增量同步原理