復原時間目標 (RTO) 是服務中斷與恢復服務之間的最大可接受延遲。這會決定可接受的服務無法使用之時間長度。例如服務發生中斷後,需要在半天內恢復,RTO就是12小時。RTO具體時間長短是從故障發生後,從系統當機導致應用停頓當下開始,到系統恢復至可以支援各部門運作之時,此兩點之間的時間段。RTO是反映業務恢復的及時性指標,表示業務從中斷到恢復正常所需的時間,RTO數值越小,代表容錯轉移的資料恢復能力越強,可以部署很多容錯轉移系統,來獲取最小的RTO,但這意味著需要投入大量資金。提升RTO的常用技術有:磁帶恢復、人工遷移、應用系統遠端切換。
復原點目標 (RPO) 是自上次資料復原點之後的最大可接受時間長度。這會決定最後一個復原點與服務中斷之間可接受的資料遺失。指的就是當業務恢復後,恢復資料所對應的時間點,RPO取決於資料恢復到怎樣的更新程度,這種更新程度可以是上週的備份資料,也可以是昨天的資料,這和資料備份的頻率有關,若要縮短RPO,必然會增加資料備份的頻率。RPO是反映恢復資料完整性的指標。在同步資料複製方式下,RPO等於資料傳輸時延的時間,在非同步資料複製方式下,RPO基本為非同步傳輸資料排隊的時間。提升RPO的常用技術有:磁帶備份、定期資料複製、非同步資料複製、同步資料複製等。
以資料庫的角度來說:
1. 加強備份 (縮短RPO)
例如:Oracle RMAN 每週 full backup、週間2、4 diff backup、每日4小時 archive log backup,那RPO就是4小時
2. 建立非同步機制 (縮短RPO)
可建立非同步資料傳輸機制,使RPO縮小至分鐘級別
Oracle : Data Guard
SQL Server : Log Shipping、Always On
PostgreSQL : Log Shipping
3. 建立容錯轉移機制 (建DR/備援主機) (縮短RTO)
採用應用程式同步方式,當發生災難時快速切換至DR/備援,那RTO就會是分鐘/秒級以下
例如資料庫的應用技術:
Oracle :Data Guard、Extended RAC
SQL Server : Always On、Replication
PostgreSQL : repmgr / Streaming replication
0 留言