EP18: Perbezaan Antara RPO & RTO
Belajar apa itu RPO & RTO dan bagaimana ia berperanan dalam strategi Disaster Recovery.
Antara topik yang penting berkaitan infrastruktur IT adalah pemulihan daripada bencana atau juga disebut Disaster Recovery (DR).
Bencana yang disebutkan disini adalah apa jua situasi yang memberi kesan kepada operasi servis, sistem, atau aplikasi. Sebagai contoh, serangan siber, kesilapan manusia, terputus bekalan elektrik, kegagalan rangkaian berfungsi, bencana alam semula jadi, perkakasan gagal berfungsi, perisisan gagal berfungsi dan juga kegagalan infrastruktur.
Terdapat dua perkara yang anda perlu ketahui apabila membincangkan berkenaan Disaster Recovery iaitu RPO dan RTO.
Recovery Point Objective (RPO)
RPO merujuk kepada maksimum jumlah kehilangan data dalam kiraan masa yang anda atau organisasi boleh terima sekiranya berlaku bencana yang akan mengganggu operasi sistem. Dalam erti kata yang lain, RPO juga merujuk kepada titik masa yang anda boleh gunakan untuk membuat restoration semula selepas bencana berlaku, berdasarkan salinan backup terakhir yang telah berjaya.
RPO diukur dalam unit masa seperti minit, jam, hari dan sebagainya. Sebagai contoh, sekiranya RPO adalah 1 jam, bermaksud anda boleh terima kemungkinan kehilangan data sehingga 1 jam.
Recovery Time Objective (RTO)
RTO pula merupakan jumlah masa maksimum yang anda boleh terima untuk pulihkan semula sistem, aplikasi atau servis kepada normal setelah berlaku bencana. Ia diukur dalam unit jumlah masa sepanjang tempoh servis tidak berfungsi, atau juga disebut sebagai downtime.
Sekiranya anda atau organisasi telah menetapkan RTO adalah 1 jam, ini bermaksud anda perlu pastikan servis mesti dikembalikan semula pada keadaan normal dalam tempoh 1 jam selepas berlaku bencana.
Contoh aplikasi RPO dan RTO
Sekiranya anda mempunyai sebuah kedai atas talian, sudah semestinya kedai anda akan mempunyai fungsi simpanan maklumat pelanggan dan juga maklumat pembelian. Semua maklumat ini disimpan dalam pangkalan data dan ianya berada dalam sebuah server fizikal.
Anda telah menetapkan jumlah maksimum kehilangan data yang anda boleh terima adalah 30 minit sekiranya berlaku bencana seperti sistem pengoperasian tidak dapat berfungsi, perkakasan server rosak atau terputus bekalan elektrik. Ini merujuk kepada RPO.
Anda juga telah menetapkan kedai atas talian anda perlu kembali beroperasi dalam masa 1 jam selepas bencana berlaku. Ini merujuk kepada RTO.
Bagaimana untuk mencapai objektif RPO dan RTO?
Terdapat beberapa kaedah untuk mencapai objektif RPO seperti :
Membuat backup secara berkala dan juga secara pertambahan atau disebut sebagai incremental backup. Ini dapat mencapai objektif RPO dan mengurangkan kos storan backup.
Membuat data replication secara berterusan ke tempat lain seperti cloud untuk memastikan data terkini sentiasa ada untuk proses restoration.
Menggunakan teknologi snapshot storan secara berkala untuk mendapatkan keadaan data (data state) ketika snapshot berlaku, dan ianya memudahkan proses restoration mengikut titik waktu yang dimahukan.
Memanfaatkan teknologi cloud untuk melakukan backup kerana ia menawarkan storan untuk backup yang dipercayai dan juga mudah untuk diskalakan kepada jumlah storan yang lebih besar.
Memastikan data yang dibackup boleh digunapakai dengan membuat ujian restoration.
Untuk mencapai objektif RTO pula, terdapat beberapa kaedah seperti berikut:
Menggunakan teknologi High-Availability (HA) yang melibatkan konfigurasi server kluster dan juga load balancer. Ia membatu mengurangkan downtime secara automatik melalui teknologi failover.
Memanfaatkan teknologi virtualization kerana anda boleh restore virtual machine kepada hypervisor yang lain dengan mudah.
Memanfaatkan teknologi cloud seperti Disaster Recovery as a service (DRaaS) yang menawarkan proses pemulihan dengan pantas.
Menggunakan alat untuk membantu proses restoration infrastruktur secara automatik seperti Infrastructure-as-Code tools atau juga Configuration Management tools.
Memastikan setiap perkakasan terutama peranti rangkaian mempunyai redundancy supaya jika sebarang masalah berlaku pada salah satu peranti rangkaian, masih ada laluan kedua untuk data dalam rangkaian beroperasi.
Melaksanakan ujian disaster recovery secara berkala bagi memastikan tiada sebarang masalah untuk proses restoration dan berapa masa yang akan diambil untuk proses restoration. Ini bagi memastikan RTO boleh dicapai. Anda juga boleh manfaatkan teknologi fault injection simulator.
Untuk memastikan kejayaan RPO dan RTO, anda juga perlu memastikan konfigurasi backup dan proses restoration di dokumentasi bagi memudahkan individu yang terlibat semasa bencana berlaku. Anda juga perlu sentiasa memantau servis, sistem, aplikasi dan infrastruktur dan menetapkan penghantaran notifikasi secara automatik sekiranya berlaku bencana kepada individu yang berkenaan.
Sertai Telegram Inframesia di : https://t.me/inframesia untuk dapatkan info terkini daripada Inframesia!