什麼是 復原時間目標 RTO (Recovery Time Objective) 和復原點目標 RPO (Recovery Point Objective)

復原時間目標 (RTO) 是服務中斷與恢復服務之間的最大可接受延遲。這會決定可接受的服務無法使用之時間長度。例如服務發生中斷後,需要在半天內恢復,RTO就是12小時。RTO具體時間長短是從故障發生後,從系統當機導致應用停頓當下開始,到系統恢復至可以支援各部門運作之時,此兩點之間的時間段。RTO是反映業務恢復的及時性指標,表示業務從中斷到恢復正常所需的時間,RTO數值越小,代表容錯轉移的資料恢復能力越強,可以部署很多容錯轉移系統,來獲取最小的RTO,但這意味著需要投入大量資金。提升RTO的常用技術有:磁帶恢復、人工遷移、應用系統遠端切換。

復原點目標 (RPO) 是自上次資料復原點之後的最大可接受時間長度。這會決定最後一個復原點與服務中斷之間可接受的資料遺失。指的就是當業務恢復後,恢復資料所對應的時間點,RPO取決於資料恢復到怎樣的更新程度,這種更新程度可以是上週的備份資料,也可以是昨天的資料,這和資料備份的頻率有關,若要縮短RPO,必然會增加資料備份的頻率。RPO是反映恢復資料完整性的指標。在同步資料複製方式下,RPO等於資料傳輸時延的時間,在非同步資料複製方式下,RPO基本為非同步傳輸資料排隊的時間。提升RPO的常用技術有:磁帶備份、定期資料複製、非同步資料複製、同步資料複製等。



以資料庫的角度來說:

1. 加強備份 (縮短RPO)

例如:Oracle RMAN 每週 full backup、週間2、4 diff backup、每日4小時 archive log backup,那RPO就是4小時

2. 建立非同步機制 (縮短RPO)

可建立非同步資料傳輸機制,使RPO縮小至分鐘級別

Oracle : Data Guard

SQL Server : Log Shipping、Always On

PostgreSQL : Log Shipping

3. 建立容錯轉移機制 (建DR/備援主機) (縮短RTO)

採用應用程式同步方式,當發生災難時快速切換至DR/備援,那RTO就會是分鐘/秒級以下

例如資料庫的應用技術:

Oracle :Data Guard、Extended RAC

SQL Server : Always On、Replication

PostgreSQL : repmgr / Streaming replication


張貼留言

0 留言