Kiểm thử phục hồi thảm họa: Những điều cần biết

khắc phục thảm họa

Bài viết này giải thích quy trình kiểm thử kế hoạch phục hồi thảm họa. Chúng tôi sẽ xem xét mục tiêu và những lợi và hại của kiểm thử và cung cấp một danh sách kiểm tra để giúp bạn.

Phục hồi thảm họa đề cập đến khả năng phản ứng và phục hồi của doanh nghiệp sau một sự kiện như tấn công mạng hoặc thảm họa thiên nhiên. Điều này có nghĩa là lên kế hoạch cho điều xấu nhất bằng cách tăng cường tính dự phòng, cố gắng loại bỏ điểm thất bại duy nhất và đảm bảo bạn có các bản sao làm việc để ngăn chặn các thảm họa làm gián đoạn liên tục của doanh nghiệp.

Kế hoạch phục hồi thảm họa

Hầu hết các công ty có hoặc nên có một kế hoạch phục hồi thảm họa, nhưng kế hoạch đó cần được kiểm thử. Kiểm thử phục hồi thảm họa là một phương tiện để đảm bảo quá trình khôi phục dữ liệu và ứng dụng bình thường là có thể thực hiện được.

Một kế hoạch phục hồi thảm họa tốt nên đảm bảo rằng tất cả các dữ liệu có thể được phục hồi để không bị mất thông tin trong dài hạn, giảm thiểu thời gian ngừng hoạt động của công nghệ thông tin và lên kế hoạch cho tính liên tục để nhân viên có thể tiếp tục hoạt động cho đến khi mọi thứ được hoàn toàn khôi phục và hoạt động.

Ở mức cao, nó nên xác định các mối đe dọa tiềm năng; phác thảo các bước để giảm thiểu rủi ro và thiết lập các quy trình để thực hiện sau một thảm họa. Nó nên là một tài liệu sống được xem xét và cải tiến nhiều lần trong năm.

Mục tiêu của Kiểm thử phục hồi thảm họa

Mục tiêu của việc kiểm tra khôi phục thảm họa là rất cần thiết cho doanh nghiệp của bạn để chuẩn bị cho các sự kiện không mong muốn. Việc kiểm tra khôi phục thảm họa bao gồm mô phỏng các thảm họa tiềm năng và đánh giá hiệu quả của kế hoạch khôi phục của bạn.

Làm như vậy giúp bạn xác định điểm yếu và điều chỉnh cần thiết trước khi sự cố thực sự xảy ra. Nó cũng sẽ xác định xem kế hoạch khôi phục thảm họa của bạn có hoạt động và đáp ứng yêu cầu của công ty không. Việc kiểm tra khôi phục thảm họa thường là một quá trình tiến hóa. Khi hệ thống thay đổi, nhóm của bạn nên kiểm tra các quy trình mới và nâng cấp.

Hãy xem lại danh sách kiểm tra gồm 9 bước để giúp bạn kiểm tra khôi phục thảm họa, bao gồm các yếu tố liên quan đến kế hoạch khẩn cấp cần có và được kiểm tra.

Danh sách kiểm tra khôi phục thảm họa

Xác định mục tiêu khôi phục RTO và RPO

Hai tiêu chí cần thiết cho khôi phục thảm họa là Mục tiêu Thời gian Khôi phục (RTO) và Mục tiêu Điểm khôi phục (RPO). RTO là thời gian tối đa mà doanh nghiệp sẽ mất để phục hồi các chức năng bình thường sau một sự cố hoặc mất dữ liệu. RPO là lượng dữ liệu tối đa mà doanh nghiệp có thể chịu đựng được mất.

RPO thường được đo bằng thời gian và kéo dài từ khi thảm họa xảy ra đến lần sao lưu dữ liệu cuối cùng – ví dụ, nếu sao lưu dữ liệu đầy đủ trước đó là 10 giờ trước sự kiện thảm họa, thì RPO là 10 giờ.

Xác định tất cả các bên liên quan

Các bên liên quan là những người tham gia, bị ảnh hưởng hoặc có một số quan tâm đối với tác động của một thảm họa đối với tổ chức. Thường có một loạt các bên liên quan nội bộ và bên ngoài liên quan đến vấn đề này. Các bên có thể bao gồm từ các trưởng phòng đến nhân viên tài chính và marketing. Xác định các bên liên quan và vai trò của họ trong phục hồi sau thảm họa và chia sẻ kế hoạch với họ sẽ giúp cho sự chuẩn bị được cải thiện.

Thiết lập kênh thông tin liên lạc

Cách bạn liên lạc với những bên liên quan này cũng quan trọng như việc xác định họ. Cách bạn liên lạc về kế hoạch phục hồi sau thảm họa phụ thuộc vào tổ chức của bạn. Bạn có thể cần bao gồm quản lý, nhân viên, nhà cung cấp, khách hàng và truyền thông.

Cách liên lạc với nhân viên sẽ khác so với cách liên lạc với công chúng. Ví dụ, bạn có thể cần thông báo cho nhân viên về bất kỳ thông tin an toàn nào và có thể làm điều này bên trong công ty, cho họ biết họ có thể chia sẻ thông tin với ai. Nếu bạn phải nói chuyện với báo chí hoặc công chúng, bạn sẽ cần cân nhắc giữa sự minh bạch và tiềm năng gây thiệt hại cho danh tiếng. Một kế hoạch tốt sẽ có các điều khoản để đối phó với điều này.

Tài liệu hóa mọi thứ

Tài liệu là một phần không thể thiếu của mọi kế hoạch phục hồi sau thảm họa. Nó nên được xem như một tài liệu sống và nên được chi tiết, cập nhật và sẵn sàng cho bất kỳ các bên liên quan hoặc nhóm nào có thể cần đến nó trong trường hợp xảy ra một thảm họa.

Những gì bạn tài liệu sẽ phụ thuộc vào tổ chức của bạn, nhưng hầu hết các doanh nghiệp sẽ thiết lập và tài liệu các vai trò và trách nhiệm, danh sách tài sản và hệ thống, phụ thuộc ứng dụng, ưu tiên và tuân thủ quy định.

Lựa chọn công nghệ

Sao lưu và Khôi phục Có hai công nghệ cơ bản được sử dụng cho kiểm tra phục hồi sau thảm họa: sao lưu và nhân bản.

Các doanh nghiệp nên cố gắng tuân thủ quy tắc 3-2-1 khi sao lưu dữ liệu:

Lưu ba bản sao của bản sao lưu của bạn Lưu hai bản sao trên các loại phương tiện khác nhau Lưu một bản sao ngoại tuyến Nhân bản giảm thiểu RTOs và RPOs bằng cách cung cấp khôi phục thông tin nhanh chóng. Nhân bản cho phép sao chép các hệ thống nguồn sang một hoặc nhiều hệ thống đích có thể được đưa trực tuyến trong trường hợp xảy ra sự cố.

Xác định Thủ tục

Phản ứng sự cố Tất cả các bên liên quan phải biết phải làm gì – và không làm gì – trong trường hợp xảy ra một thảm họa. Kế hoạch của bạn nên bao gồm phản ứng sự cố, nêu rõ cách mà mỗi bên liên quan nên phản ứng trong trường hợp xảy ra một sự cố an ninh mạng hoặc thảm họa khác, bao gồm cách xác định mối đe dọa, cách kiểm soát và ngăn chặn mối đe dọa, cách đánh giá thiệt hại và cách khôi phục các hệ thống bị ảnh hưởng. Các vai trò nên được xác định rõ ràng.

Xác định quy trình phản ứng và xác minh

Cách xác định quy trình phản ứng và xác minh sẽ phụ thuộc vào doanh nghiệp của bạn. Đầu tiên, bạn cần phải biết các bước cần thực hiện để trở lại trạng thái bình thường. Tiếp theo, xác định hệ thống nào nên được sử dụng và cách sử dụng hệ thống đó. Cuối cùng, chọn các thủ tục cụ thể và người sẽ thực hiện các thủ tục đó.

Lý tưởng nhất là bạn nên tính đến các loại thảm họa khác nhau, bao gồm thảm họa tự nhiên, tai nạn và các cuộc tấn công độc hại, với hướng dẫn cụ thể cho mỗi loại thảm họa.

Thực hiện các bài kiểm tra phục hồi thảm họa thường xuyên

Việc thường xuyên kiểm tra có thể giúp doanh nghiệp của bạn chuẩn bị cho các thảm họa và xác định bất kỳ điểm yếu nào trong kế hoạch phục hồi thảm họa của bạn. Các lĩnh vực cần cải thiện sẽ trở nên rõ ràng trong các thử nghiệm kiểm tra. Điều chỉnh các bước khi cần thiết để tiết kiệm thời gian và tiền bạc.

Việc kiểm tra thường xuyên giúp chuẩn bị cho đội ngũ của bạn để hoạt động hiệu quả trong trường hợp khẩn cấp thực sự. Hầu hết các doanh nghiệp nên xác minh hiệu quả của kế hoạch kiểm tra phục hồi thảm họa của họ ít nhất một lần mỗi năm.

Cập nhật thông tin

Sau khi thực hiện các bài kiểm tra phục hồi thảm họa, cập nhật kế hoạch của bạn dựa trên những gì đội của bạn học được trong quá trình kiểm tra. Giữ một danh sách những gì đã hoạt động trong quá trình kiểm tra và những gì không hoạt động. Đảm bảo giữ tài liệu hiện tại và dễ dàng truy cập cho tất cả các bên liên quan.

Phương pháp kiểm tra khôi phục thảm họa

Có năm phương pháp chính để kiểm tra khôi phục thảm họa, bao gồm:

Kiểm thử dẫn đường (Walkthrough testing)

Kiểm thử dẫn đường – còn được gọi là kiểm thử bàn đạp – đề cập đến quá trình thu thập tất cả các bên liên quan và thực hiện việc đi qua từng bước được đề ra trong kế hoạch phục hồi thảm họa của bạn. Thông thường, mọi người sẽ đi qua từng bước để xác định rằng mọi người hiểu rõ vai trò của họ trong trường hợp khẩn cấp. Bên cạnh đó, đội của bạn cũng nên đưa ra các điểm thiếu sót, thông tin bị thiếu hoặc không nhất quán được tìm thấy trong quá trình kiểm thử.

Kiểm thử mô phỏng (Simulation testing)

Kiểm thử mô phỏng là một cách tốt để xem liệu kế hoạch của bạn có hoạt động trong một thảm họa thực sự hay không. Ý tưởng là mô phỏng một thảm họa thực sự một cách chính xác nhất có thể trong khi chạy các kịch bản khác nhau và kiểm tra các hệ thống sao lưu, trang web phục hồi và các nguồn lực khác. Các kịch bản này sẽ giúp đội của bạn kiểm tra sự chuẩn bị của họ cho việc khởi động lại hoạt động một cách kịp thời. Bạn sẽ nhanh chóng biết được liệu bạn có đủ số lượng và đủ người để khởi động lại hoạt động của mình.

Kiểm thử theo danh sách kiểm tra (Checklist testing)

Kiểm thử theo danh sách kiểm tra là quá trình đi qua danh sách kiểm tra phục hồi thảm họa của doanh nghiệp để đảm bảo bạn đã cân nhắc đến mọi góc nhìn, nguồn lực và mục tiêu. Kiểm thử danh sách kiểm tra của bạn sẽ giúp làm sáng tỏ bất cứ điều gì cần được cập nhật.

Kiểm thử gián đoạn toàn bộ (Full interruption testing)

Đối với phương pháp Full interruption testing, đây là phương pháp kiểm tra đầy đủ nhất vì nó thực hiện việc tạm dừng toàn bộ hoạt động tại trang web chính và chuyển đến trang web khôi phục như được đề cập trong kế hoạch phục hồi sau thảm họa. Đội ngũ của bạn sẽ sử dụng dữ liệu và thiết bị thực tế của bạn trong kiểm tra DR này. Tuy nhiên, phương pháp này có thể gây ra thảm họa riêng của nó và gây gián đoạn cho các hoạt động nếu kiểm tra thất bại.

Parallel testing

Phương pháp kiểm tra tiếp theo là Parallel testing, bao gồm việc thử nghiệm các hệ thống khôi phục để xem chúng có thể thực hiện các giao dịch kinh doanh và hỗ trợ các quy trình của công ty của bạn hay không. Trong kiểm tra này, các hệ thống chính vẫn hoạt động bình thường.

Thử nghiệm phục hồi sau thảm họa là một quá trình liên tục và đội ngũ của bạn sẽ cần phải điều chỉnh và cập nhật kế hoạch của mình. Việc biết các thực tiễn tốt nhất cho kiểm tra phục hồi sau thảm họa sẽ rất hữu ích. Trong một môi trường thay đổi liên tục, việc tuân thủ những lý tưởng này là rất quan trọng:

  • Kiểm tra nhiều hoặc tất cả các kịch bản có thể xảy ra
  • Kiểm tra thường xuyên
  • Ghi chép tất cả mọi thứ
  • Cập nhật cho mọi người
  • Đánh giá kết quả

Điểm mấu chốt: Kiểm tra phục hồi sau thảm họa: Những điều bạn cần biết

Có một kế hoạch phục hồi sau thảm họa không chỉ là các hành động trên một tờ giấy. Đó là việc phải biết các bên liên quan và các quy trình và thường xuyên điều chỉnh để sẵn sàng trong trường hợp khẩn cấp.

Thường xuyên kiểm tra kế hoạch phục hồi sau thảm họa của bạn, điều chỉnh nếu cần và cập nhật thông tin và đội ngũ của bạn để giúp giảm thiểu rủi ro. Đội ngũ của bạn càng được chuẩn bị và cập nhật, thì sẽ càng nhanh chóng khôi phục lại hoạt động với thiệt hại ít nhất có thể.

Câu hỏi thường gặp về kiểm tra phục hồi sau thảm họa

Ai chịu trách nhiệm cho kiểm tra phục hồi sau thảm họa?

Đội ngũ phục hồi sau thảm họa của bạn thường xuyên kiểm tra và cập nhật kế hoạch phục hồi sau thảm họa để giải quyết các vấn đề tiến triển.

Mục đích của kiểm tra Phục hồi sau Thảm họa (DR) là gì?

Một kiểm tra DR đảm bảo rằng kế hoạch phục hồi sau thảm họa là hợp lệ và kiểm tra tính sẵn sàng và khôi phục các hoạt động kinh doanh trong một thời gian xác định nếu xảy ra thảm họa.

Kiểm tra phục hồi sau thảm họa nên được thực hiện bao lâu một lần?

Thử nghiệm khắc phục thảm họa nên được thực hiện mỗi năm một lần.

Hiện tại máy chủ vina cung cấp các dịch vụ về tài nguyên để chuẩn bị khắc phục thảm họa.

Để lại một bình luận

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *

Con gà có trước hay quả trứng có trước?