參考資料: 一、對Redis持久化的探討與理解 目前Redis持久化的方式有兩種: RDB 和 AOF
首先,我們應(yīng)該明確持久化的數(shù)據(jù)有什么用,答案是用于重啟后的數(shù)據(jù)恢復(fù)。
RDB就是Snapshot快照存儲,是默認(rèn)的持久化方式。 save 900 1 #當(dāng)有一條Keys數(shù)據(jù)被改變時(shí),900秒刷新到Disk一次 save 300 10 #當(dāng)有10條Keys數(shù)據(jù)被改變時(shí),300秒刷新到Disk一次 save 60 10000 #當(dāng)有10000條Keys數(shù)據(jù)被改變時(shí),60秒刷新到Disk一次
Redis的RDB文件不會(huì)壞掉,因?yàn)槠鋵懖僮魇窃谝粋€(gè)新進(jìn)程中進(jìn)行的。
同時(shí),Redis的RDB文件也是Redis主從同步內(nèi)部實(shí)現(xiàn)中的一環(huán)。
可以很明顯的看到,RDB有它的不足,就是一旦數(shù)據(jù)庫出現(xiàn)問題,那么我們的RDB文件中保存的數(shù)據(jù)并不是全新的。
AOF(Append-Only File)比RDB方式有更好的持久化性。 appendonly yes #啟用AOF持久化方式 appendfilename appendonly.aof #AOF文件的名稱,默認(rèn)為appendonly.aof # appendfsync always #每次收到寫命令就立即強(qiáng)制寫入磁盤,是最有保證的完全的持久化,但速度也是最慢的,一般不推薦使用。 appendfsync everysec #每秒鐘強(qiáng)制寫入磁盤一次,在性能和持久化方面做了很好的折中,是受推薦的方式。 # appendfsync no #完全依賴OS的寫入,一般為30秒左右一次,性能最好但是持久化最沒有保證,不被推薦。
AOF的完全持久化方式同時(shí)也帶來了另一個(gè)問題,持久化文件會(huì)變得越來越大。 no-appendfsync-on-rewrite yes #在日志重寫時(shí),不進(jìn)行命令追加操作,而只是將其放在緩沖區(qū)里,避免與命令的追加造成DISK IO上的沖突。 auto-aof-rewrite-percentage 100 #當(dāng)前AOF文件大小是上次日志重寫得到AOF文件大小的二倍時(shí),自動(dòng)啟動(dòng)新的日志重寫過程。 auto-aof-rewrite-min-size 64mb #當(dāng)前AOF文件啟動(dòng)新的日志重寫過程的最小值,避免剛剛啟動(dòng)Reids時(shí)由于文件尺寸較小導(dǎo)致頻繁的重寫。
到底選擇什么呢?下面是來自官方的建議:
在數(shù)據(jù)恢復(fù)方面:
二、災(zāi)難恢復(fù)模擬
首先,修改Master上的如下配置: #save 900 1 #禁用Snapshot #save 300 10 #save 60 10000 appendonly no #禁用AOF
接著,修改Slave上的如下配置: save 900 1 #啟用Snapshot save 300 10 save 60 10000 appendonly yes #啟用AOF appendfilename appendonly.aof #AOF文件的名稱 # appendfsync always appendfsync everysec #每秒鐘強(qiáng)制寫入磁盤一次 # appendfsync no no-appendfsync-on-rewrite yes #在日志重寫時(shí),不進(jìn)行命令追加操作 auto-aof-rewrite-percentage 100 #自動(dòng)啟動(dòng)新的日志重寫過程 auto-aof-rewrite-min-size 64mb #啟動(dòng)新的日志重寫過程的最小值
分別啟動(dòng)Master與Slave
啟動(dòng)完成后在Master中確認(rèn)未啟動(dòng)Snapshot參數(shù)
然后通過以下腳本在Master中生成25萬條數(shù)據(jù): #!/bin/bash REDISCLI="redis-cli -a slavepass -n 1 SET" ID=1 while(($ID<50001)) do INSTANCE_NAME="i-2-$ID-VM" UUID=`cat /proc/sys/kernel/random/uuid` PRIVATE_IP_ADDRESS=10.`echo "$RANDOM % 255 + 1" | bc`.`echo "$RANDOM % 255 + 1" | bc`.`echo "$RANDOM % 255 + 1" | bc` CREATED=`date "+%Y-%m-%d %H:%M:%S"` $REDISCLI vm_instance:$ID:instance_name "$INSTANCE_NAME" $REDISCLI vm_instance:$ID:uuid "$UUID" $REDISCLI vm_instance:$ID:private_ip_address "$PRIVATE_IP_ADDRESS" $REDISCLI vm_instance:$ID:created "$CREATED" $REDISCLI vm_instance:$INSTANCE_NAME:id "$ID" ID=$(($ID+1)) done dongguo@redis:/opt/redis/data/6379$ ./redis-cli-generate.temp.sh
在數(shù)據(jù)的生成過程中,可以很清楚的看到Master上僅在第一次做Slave同步時(shí)創(chuàng)建了dump.rdb文件,之后就通過增量傳輸命令的方式給Slave了。
而Slave上則可以看到dump.rdb文件和AOF文件在不斷的增大,并且AOF文件的增長速度明顯大于dump.rdb文件。
等待數(shù)據(jù)插入完成以后,首先確認(rèn)當(dāng)前的數(shù)據(jù)量。 redis_version:2.4.17 redis_git_sha1:00000000 redis_git_dirty:0 arch_bits:64 multiplexing_api:epoll gcc_version:4.4.5 process_id:27623 run_id:e00757f7b2d6885fa9811540df9dfed39430b642 uptime_in_seconds:1541 uptime_in_days:0 lru_clock:650187 used_cpu_sys:69.28 used_cpu_user:7.67 used_cpu_sys_children:0.00 used_cpu_user_children:0.00 connected_clients:1 connected_slaves:1 client_longest_output_list:0 client_biggest_input_buf:0 blocked_clients:0 used_memory:33055824 used_memory_human:31.52M used_memory_rss:34717696 used_memory_peak:33055800 used_memory_peak_human:31.52M mem_fragmentation_ratio:1.05 mem_allocator:jemalloc-3.0.0 loading:0 aof_enabled:0 changes_since_last_save:250000 bgsave_in_progress:0 last_save_time:1348677645 bgrewriteaof_in_progress:0 total_connections_received:250007 total_commands_processed:750019 expired_keys:0 evicted_keys:0 keyspace_hits:0 keyspace_misses:0 pubsub_channels:0 pubsub_patterns:0 latest_fork_usec:246 vm_enabled:0 role:master slave0:10.6.1.144,6379,online db1:keys=250000,expires=0 當(dāng)前的數(shù)據(jù)量為25萬條key,占用內(nèi)存31.52M。
然后我們直接Kill掉Master的Redis進(jìn)程,模擬災(zāi)難。
我們到Slave中查看狀態(tài): redis_version:2.4.17 redis_git_sha1:00000000 redis_git_dirty:0 arch_bits:64 multiplexing_api:epoll gcc_version:4.4.5 process_id:13003 run_id:9b8b398fc63a26d160bf58df90cf437acce1d364 uptime_in_seconds:1627 uptime_in_days:0 lru_clock:654181 used_cpu_sys:29.69 used_cpu_user:1.21 used_cpu_sys_children:1.70 used_cpu_user_children:1.23 connected_clients:1 connected_slaves:0 client_longest_output_list:0 client_biggest_input_buf:0 blocked_clients:0 used_memory:33047696 used_memory_human:31.52M used_memory_rss:34775040 used_memory_peak:33064400 used_memory_peak_human:31.53M mem_fragmentation_ratio:1.05 mem_allocator:jemalloc-3.0.0 loading:0 aof_enabled:1 changes_since_last_save:3308 bgsave_in_progress:0 last_save_time:1348718951 bgrewriteaof_in_progress:0 total_connections_received:4 total_commands_processed:250308 expired_keys:0 evicted_keys:0 keyspace_hits:0 keyspace_misses:0 pubsub_channels:0 pubsub_patterns:0 latest_fork_usec:694 vm_enabled:0 role:slave aof_current_size:17908619 aof_base_size:16787337 aof_pending_rewrite:0 aof_buffer_length:0 aof_pending_bio_fsync:0 master_host:10.6.1.143 master_port:6379 master_link_status:down master_last_io_seconds_ago:-1 master_sync_in_progress:0 master_link_down_since_seconds:25 slave_priority:100 db1:keys=250000,expires=0
可以看到master_link_status的狀態(tài)已經(jīng)是down了,Master已經(jīng)不可訪問了。 下面我們將通過Slave上保存好的AOF與RDB文件來恢復(fù)Master上的數(shù)據(jù)。
首先,將Slave上的同步狀態(tài)取消,避免主庫在未完成數(shù)據(jù)恢復(fù)前就重啟,進(jìn)而直接覆蓋掉從庫上的數(shù)據(jù),導(dǎo)致所有的數(shù)據(jù)丟失。
確認(rèn)一下已經(jīng)沒有了master相關(guān)的配置信息: redis_version:2.4.17 redis_git_sha1:00000000 redis_git_dirty:0 arch_bits:64 multiplexing_api:epoll gcc_version:4.4.5 process_id:13003 run_id:9b8b398fc63a26d160bf58df90cf437acce1d364 uptime_in_seconds:1961 uptime_in_days:0 lru_clock:654215 used_cpu_sys:29.98 used_cpu_user:1.22 used_cpu_sys_children:1.76 used_cpu_user_children:1.42 connected_clients:1 connected_slaves:0 client_longest_output_list:0 client_biggest_input_buf:0 blocked_clients:0 used_memory:33047696 used_memory_human:31.52M used_memory_rss:34779136 used_memory_peak:33064400 used_memory_peak_human:31.53M mem_fragmentation_ratio:1.05 mem_allocator:jemalloc-3.0.0 loading:0 aof_enabled:1 changes_since_last_save:0 bgsave_in_progress:0 last_save_time:1348719252 bgrewriteaof_in_progress:0 total_connections_received:4 total_commands_processed:250311 expired_keys:0 evicted_keys:0 keyspace_hits:0 keyspace_misses:0 pubsub_channels:0 pubsub_patterns:0 latest_fork_usec:1119 vm_enabled:0 role:master aof_current_size:17908619 aof_base_size:16787337 aof_pending_rewrite:0 aof_buffer_length:0 aof_pending_bio_fsync:0 db1:keys=250000,expires=0
在Slave上復(fù)制數(shù)據(jù)文件:
將data.tar上傳到Master上,嘗試恢復(fù)數(shù)據(jù):
然后解壓縮數(shù)據(jù)文件:
啟動(dòng)Master上的Redis;
查看數(shù)據(jù)是否恢復(fù): redis_version:2.4.17 redis_git_sha1:00000000 redis_git_dirty:0 arch_bits:64 multiplexing_api:epoll gcc_version:4.4.5 process_id:16959 run_id:6e5ba6c053583414e75353b283597ea404494926 uptime_in_seconds:22 uptime_in_days:0 lru_clock:650292 used_cpu_sys:0.18 used_cpu_user:0.20 used_cpu_sys_children:0.00 used_cpu_user_children:0.00 connected_clients:1 connected_slaves:0 client_longest_output_list:0 client_biggest_input_buf:0 blocked_clients:0 used_memory:33047216 used_memory_human:31.52M used_memory_rss:34623488 used_memory_peak:33047192 used_memory_peak_human:31.52M mem_fragmentation_ratio:1.05 mem_allocator:jemalloc-3.0.0 loading:0 aof_enabled:0 changes_since_last_save:0 bgsave_in_progress:0 last_save_time:1348680180 bgrewriteaof_in_progress:0 total_connections_received:1 total_commands_processed:1 expired_keys:0 evicted_keys:0 keyspace_hits:0 keyspace_misses:0 pubsub_channels:0 pubsub_patterns:0 latest_fork_usec:0 vm_enabled:0 role:master db1:keys=250000,expires=0 可以看到25萬條數(shù)據(jù)已經(jīng)完整恢復(fù)到了Master上。
此時(shí),可以放心的恢復(fù)Slave的同步設(shè)置了。
查看同步狀態(tài): redis_version:2.4.17 redis_git_sha1:00000000 redis_git_dirty:0 arch_bits:64 multiplexing_api:epoll gcc_version:4.4.5 process_id:13003 run_id:9b8b398fc63a26d160bf58df90cf437acce1d364 uptime_in_seconds:2652 uptime_in_days:0 lru_clock:654284 used_cpu_sys:30.01 used_cpu_user:2.12 used_cpu_sys_children:1.76 used_cpu_user_children:1.42 connected_clients:2 connected_slaves:0 client_longest_output_list:0 client_biggest_input_buf:0 blocked_clients:0 used_memory:33056288 used_memory_human:31.52M used_memory_rss:34766848 used_memory_peak:33064400 used_memory_peak_human:31.53M mem_fragmentation_ratio:1.05 mem_allocator:jemalloc-3.0.0 loading:0 aof_enabled:1 changes_since_last_save:0 bgsave_in_progress:0 last_save_time:1348719252 bgrewriteaof_in_progress:1 total_connections_received:6 total_commands_processed:250313 expired_keys:0 evicted_keys:0 keyspace_hits:0 keyspace_misses:0 pubsub_channels:0 pubsub_patterns:0 latest_fork_usec:12217 vm_enabled:0 role:slave aof_current_size:17908619 aof_base_size:16787337 aof_pending_rewrite:0 aof_buffer_length:0 aof_pending_bio_fsync:0 master_host:10.6.1.143 master_port:6379 master_link_status:up master_last_io_seconds_ago:0 master_sync_in_progress:0 slave_priority:100 db1:keys=250000,expires=0 master_link_status顯示為up,同步狀態(tài)正常。
在此次恢復(fù)的過程中,我們同時(shí)復(fù)制了AOF與RDB文件,那么到底是哪一個(gè)文件完成了數(shù)據(jù)的恢復(fù)呢? 也就是說,AOF的優(yōu)先級要高于RDB,這也很好理解,因?yàn)锳OF本身對數(shù)據(jù)的完整性保障要高于RDB。 在此次的案例中,我們通過在Slave上啟用了AOF與RDB來保障了數(shù)據(jù),并恢復(fù)了Master。
但在我們目前的線上環(huán)境中,由于數(shù)據(jù)都設(shè)置有過期時(shí)間,采用AOF的方式會(huì)不太實(shí)用,過于頻繁的寫操作會(huì)使AOF文件增長到異常的龐大,大大超過了我們實(shí)際的數(shù)據(jù)量,這也會(huì)導(dǎo)致在進(jìn)行數(shù)據(jù)恢復(fù)時(shí)耗用大量的時(shí)間。 |
|