redis主从复制
注意:我使用的版本是6.0.10,不同版本可能略有差别
虽然redis有持久化的功能可以保证redis服务重启不会丢失数据,但是如果redis服务器的硬盘损坏就会导致数据丢失,使用主从复制来避免这种单点故障。
主机数据更新后根据配置和策略自动同步到备机的master/slave机制,master以写为主,slave以读为主
原理
主要是使用PSYNC命令来实现
PSYNC命令具有全同步和部分同步两种模式
redis会首先尝试部分同步,如果失败才会尝试全同步。slave连接master后,会主动发起psync命令,slave会提供master_runid和offset,master验证maste_runid和offset是否有效,master_runid相当于master的身份验证码,用来验证slave上一次连接的master,offset是全局积压空间数据的偏移量。如果验证未通过,则进行全同步
- 全同步用于处理初次复制的情况:slave启动成功连接到master后会发送一个psync命令,master接到命令后会启动后台创建并发送RDB文件,完成后将命令发送给slave
- 部分同步用于处理断线后重复制的情况:在断线后重连,slave向master发送psync命令,master将断线之后的写命令发送给slave
那么如何知道slave和master之间只差了这几个命令呢?
是因为master和slave在复制的时候都维护了一个复制偏移量,而master在复制积压缓冲区中会保存一部分最近传播的写命令,为每个字节来记录相应的复制偏移量,可以根据复制偏移量来找到对应的字节,当然,如果复制积压缓冲区中没有这个偏移量了,那么就只能进行全量复制了
redis默认的复制积压缓冲区为1mb,可以修改配置中repl-backlog-size 来进行调整
配置
配主不配从,配置slave即可,使得slave时刻盯住主机
在这里由于我只有一台电脑,所以只能用三个配置文件来启动三个redis服务了,带有配置文件的启动服务
1 | redis-server redis79.conf |
以及使用端口启动客户端
1 | redis-cli -p 6379 |
启动之后就可以配置从机了
1 | replicaof 127.0.0.1 6379 |
在5.0之后使用replicaof,5.0之前使用slaveof 不过当前slaveof还没有失效
1 | # 可以配置最少有多少个从节点 主节点才可以写 |
一主两仆
graph TD master79-->slave80 master79-->slave81
看一下执行命令之前的配置变化(使用info replication来查看)
1 | #之前 |
重点:
- 从机会将主机的所有数据进行备份
- 从机只能读,不能写(error) READONLY You can’t write against a read only replica.
- 主机挂了之后,从机身份不变(master_link_status变成down),直到主机回来,主机回来之后还是主机
- 从机挂了之后需要重新执行从属命令replicaof 127.0.0.1 6379(如果是直接在配置文件中配置的从属关系则不需要)
可以使用命令来将从库变成主库
1 | replicaof no one |
在5.0之后使用replicaof,5.0之前使用slaveof 不过当前slaveof还没有失效
薪火相传
由于一主两仆机制会导致主机挂掉之后整个redis就挂掉的问题,所以为了去中心化,有了薪火相传机制,上一个slave可能是下一个slave的master,slave同样可以接收其他的slave的连接和请求,可以有效地减轻master的写压力
graph LR master79-->slave80-->slave81
这里slave80对于slave81是主机,对于master79是从机
该机制可能会存在延迟
哨兵模式
由于一主两从的主库挂掉之后,需要人工的去干预从库反客为主,再进行更改主从配置,而哨兵模式通过监听主库是否挂掉,从库根据投票来决定自动将从库切换为主库
基本原理是 心跳机制+投票
配置redis-sentinel.conf配置文件
1 | #sentinel monitor master-name ip redis-port quorum |
哨兵启动
1 | redis-sentinel redis-sentinel.conf |
当主库挂掉之后,从库进行重新选举出新的主库,原来的主库回来之后,只会成为从库,不会变成双主库
查看哨兵信息
1 | redis-cli -h 127.0.0.1 -p 26379 info Sentinel |
哨兵的功能
哨兵节点不同于数据节点,不存储数据,且仅支持部分命令
- 配置提供者 客户端在初始化时,通过连接哨兵来获得当时redis服务的主节点地址
- 监控: sentinel会不断地检查主服务器和从服务器是否运作正常
- 通知: 当被监控的某个redis服务器出现问题时,sentinel可以通过API向管理员或者其他应用程序发送通知
- 自动故障迁移: 当一个主服务器不能正常工作时,sentinel会开始一次自动故障迁移操作,将失效主服务器的其中一个从服务器升级为新的主服务器,并让失效主服务器的其他从服务器改为复制新的主服务器,当客户端试图链接失效的主服务器时,集群也会向客户端返回新主服务器的地址,使得集群可以使用新主服务器代替失效服务器
选举新的主服务器
sentinel会将所有的从服务器保存到一个列表中,然后进行筛选
- 首先会删除掉下线的从服务器
- 然后删除掉最近五秒内没有回复过sentinel的info命令的从服务器
- 删除掉与主服务连接断开超过down-after-milliseconds * 10 毫秒的从服务器(down-after-milliseconds表示判断主服务器下线所需的时间)
- 根据从服务器优先级进行排序,如果有多个最高优先级的从服务器,则选出偏移量最大的
- 如果存在多个最高优先级、复制偏移量最大的从服务器,则按照id进行排序,选出id最小的
sentinel是不会监控从服务器的,所以如果从服务器挂掉之后,sentinel是不会对其进行故障转移的
哨兵原理
首先哨兵需要进行状态感知,在哨兵启动的时候是指定了master的地址的,哨兵每隔10s会向master节点发送info命令,info命令中包含了主从拓扑关系,如果master挂掉之后,哨兵会选择合适的slave节点进行故障恢复,即向所选的slave节点发送replicaof no one
命令,使其变成master,然后向其他slave节点发送 replicaof $newmaster
命令
作用
- 读写分离
- 灾备