เทคนิคและเทคโนโลยีของการสำรองข้อมูล Backup
ประเภท เทคนิคและเทคโนโลยีของการสำรองข้อมูล Backup ในปัจจุบันมีหลากหลายและมีพัฒนาการอย่างต่อเนื่องมาอย่างยาวนาน ที่สามารถให้องค์กรและผู้ใช้งานสามารถประยุคใช้สำหรับการสำรองข้อมูลภายใต้ SLA ที่กำหนดได้ รวมทั้งเพื่อตอบโจทย์ความต้องการในส่วนของ Recovery Time Objective (RTO) และ Recovery Point Object (RPO) ทางเลือกของการสำรองข้อมูลยังขึ้นอยู่กับความสามารถของแอปพลิเคชั่นสำรองข้อมูลด้วยเช่นกัน
ประเภทของการสำรองข้อมูลและการสำรองข้อมูลมีกี่วิธี?
การสำรองข้อมูลมีหลายวิธีดังต่อไปนี้
- Full Backup จะรวบรวมสำเนาของชุดข้อมูลทั้งหมด และถือเป็นวิธีสำรองข้อมูลที่น่าเชื่อถือที่สุด แต่การสำรองข้อมูลทั้งหมดนั้นใช้เวลานานและต้องใช้ดิสก์หรือเทปจำนวนมาก องค์กรส่วนใหญ่เรียกใช้การสำรองข้อมูล Full Backup ทั้งหมดเป็นครั้งๆ เช่น สัปดาห์ละครั้งเท่านั้น

- Incremental Backup การสำรองข้อมูลเฉพาะส่วนเพิ่มเป็นการแทนการสำรองข้อมูลแบบ Full Backup โดยสำรองเฉพาะข้อมูลที่เปลี่ยนแปลงตั้งแต่การสำรองข้อมูลจากครั้งล่าสุด ข้อเสียคือการกู้คืนข้อมูลทั้งหมดจะใช้เวลานาน เพราะต้องนำข้อมูลจากการสำรองข้อมูลแบบ Full Backup มาใช้ร่วมกับการสำรองข้อมูล Incremental ทั้งหมดที่มี

- Differential Backup การสำรองข้อมูลเฉพาะส่วนต่างจาก Full Backup เป็นการคัดลอกข้อมูลที่เปลี่ยนแปลงไปจากการสำรองข้อมูลทั้งหมด Full Backup ครั้งล่าสุด ซึ่งช่วยให้การกู้คืนทั้งหมดเกิดขึ้นได้รวดเร็วยิ่งขึ้นโดยต้องการกู้คืนเฉพาะการสำรองข้อมูลแบบ Full Backup ล่าสุดและการสำรองข้อมูล Differential Backup ส่วนต่างล่าสุด ตัวอย่างเช่น หากคุณสร้างข้อมูลสำรองแบบ Full Backup ในวันจันทร์ ข้อมูลสำรอง Differential Backup ของวันอังคารจะคล้ายกับการสำรองข้อมูลส่วนเพิ่ม ณ จุดนั้น การสำรองข้อมูลของวันพุธจะสำรองข้อมูลส่วนต่างที่เปลี่ยนไปตั้งแต่การสำรองข้อมูล Full Backup ของวันจันทร์ ข้อเสียคือ การเพิ่มของข้อมูลของการสำรองข้อมูล Differential Backup ส่วนต่างมีแนวโน้มที่จะมากขึ้นและส่งผลเสียต่อระยะเวลาในการสำรองข้อมูลของคุณ การกู้คืนข้อมูลส่วนต่างจะสร้างไฟล์โดยการรวมสำเนาที่สมบูรณ์ของการสำรองข้อมูลแบบทั้งหมดก่อนหน้านี้เข้ากับสำเนาส่วนเพิ่มอย่างน้อยหนึ่งชุดที่สร้างขึ้นในภายหลัง

- Synthetic full backup เป็นรูปแบบหนึ่งของการสำรองข้อมูล Differential Backup ในการสำรองข้อมูลแบบ Synthetic full backup ระบบจะสร้างข้อมูล Full Backup ขึ้นมาโดยอิงตามข้อมูล Full Backup และ Differential Backup

- Incremental-forever backup การสำรองแบบนี้จะลดระยะเวลาในการการสำรองข้อมูล ในขณะเดียวกันก็ทำให้สามารถกู้คืนข้อมูลที่รวดเร็วยิ่งขึ้น การสำรองข้อมูล Incremental-forever backup จะทำการสำรองข้อมูลเฉพาะส่วนที่แตกต่างจากการสำรองข้อมูล Incremental ครั้งล่าสุด และการกู้คืนข้อมูลจะรวบรวมชุดข้อมูลทั้งหมดแล้วเสริมด้วยการชุดสำรองข้อมูล Incremental Backup เพื่อให้ได้ข้อมูลตามที่ต้องการ

- นอกจากนั้น ยังมีการสำรองข้อมูล Incremental เฉพาะบล็อคที่เปลี่ยนแปลงนั้นเรียกว่า Infinite Incremental (I2) หรือ Delta Differencing โดยทั่วไปการสำรองข้อมูลรูปแบบนี้ชุดข้อมูลทั้งหมดจะถูกเก็บไว้ในเซิร์ฟเวอร์สำรองข้อมูล ซึ่งจะทำให้การกู้คืนเป็นไปโดยง่ายและมีความรวดเร็ว

- Reverse-incremental backups การสำรองข้อมูลแบบนี้จะเป็นการทำงานรวมส่วนแตกต่างที่เกิดขึ้นระหว่างสองชุดสำรองข้อมูล เมื่อทำการสำรองข้อมูล Full Backup ครั้งแรกเสร็จสิ้น การสำรองข้อมูลส่วน Incremental ครั้งถัดมาจะถูกรวมเข้าสู่ชุดสำรองข้อมูลก่อนหน้าเพื่อสร้างชุดข้อมูล Full Backup ใหม่ เพื่อให้ได้ชุดข้อมูล Full Backup ล่าสุดตลอดเวลา และเมื่อมีการทำการสำรองข้อมูล Incremental ในครั้งถัดไป ก็จะได้ชุดข้อมูล Full Backup ใหม่อีกครั้งและข้อมูลที่แตกต่างจะถูกจัดเก็บเป็นชุด Incremental ก่อนหน้า
- การสำรองข้อมูลรูปแบบนี้ มีข้อดีคือ จะได้รับข้อมูลชุด Full Backup ใหม่ตลอดเวลา แต่มีข้อเสียคือการกู้คืนชุดข้อมูลก่อนหน้าชุด Full Backup ล่าสุดจะใช้ระยะเวลานาน

เทคนิคและเทคโนโลยีในการสำรองข้อมูล
- Continuous data protection (CDP) การปกป้องและสำรองข้อมูลอย่างต่อเนื่อง หมายถึง เทคโนโลยีที่ออกแบบมาเพื่อปรับปรุงการปกป้องข้อมูลให้ดีขึ้น ระบบจัดเก็บข้อมูลแบบ CDP จะสำรองข้อมูลทุกครั้งตลอดเวลาที่มีการเปลี่ยนแปลง ระบบ CDP ช่วยให้สามารถสร้างสำเนาข้อมูลได้หลายชุด ระบบ CDP จำนวนมากมีความสามารถในตัวที่ Replicate ข้อมูลจากเซิร์ฟเวอร์หลักไปยังเซิร์ฟเวอร์สำรองและ/หรือที่เก็บข้อมูลแบบเทป การสำรองข้อมูลจากดิสก์สู่ดิสก์สู่เทปเป็นสถาปัตยกรรมยอดนิยมสำหรับระบบ CDP

- Near-continuous CDP จะใช้วิธีการ Backup Snapshot โดยการตั้งเวลาตามที่กำหนด ซึ่งจะแตกต่างจากการทำ Snapshot ของระบบ Storage ที่จะทำการสำรองข้อมูลใหม่เมื่อมีการเขียนข้อมูลไปสู่ Storage
- Data Reduction คือการลดข้อมูลและลดพื้นที่จัดเก็บข้อมูลของคุณ มีสองวิธีหลัก: การบีบอัดข้อมูล (Compression) และการขจัดข้อมูลซ้ำซ้อน (Deduplication) วิธีการเหล่านี้สามารถใช้เพียงอย่างเดียวหรือร่วมกันก็ได้ แต่ผู้ขายมักจะรวมวิธีการต่างๆ เข้าด้วยกัน การลดขนาดของข้อมูลมีผลกระทบต่อระยะเวลาการสำรองและเวลาในการกู้คืนข้อมูล

- Disk Cloning เป็นการเกี่ยวข้องกับการคัดลอกเนื้อหาของฮาร์ดไดรฟ์ของคอมพิวเตอร์ และบันทึกเป็นไฟล์ และถ่ายโอนไปยังสื่อบันทึกข้อมูลต่างๆ การโคลนดิสก์สามารถใช้สำหรับการจัดเตรียมระบบ การกู้คืนระบบ และการทำให้ระบบกลับเป็นการกำหนดค่าดั้งเดิม
- Erasure coding (Forward Error Correction) เป็นการพัฒนาให้เป็นทางเลือกที่เข้ามาทดแทนระบบ RAID ของดิสก์ ซึ่งโดยมากจะใช้กับ Object Storage โดยจะเขียนข้อมูลในไดรฟ์หลายตัว โดยใช้ Parity Drive เพื่อให้แน่ใจว่ามีข้อมูลความซ้ำซ้อนมีความยืดหยุ่นและมีความคงทน เทคโนโลยีนี้แบ่งข้อมูลเป็นส่วนย่อยและเข้ารหัสด้วยบิตข้อมูลเพื่อเก็บและสามารถกู้คืนข้อมูลได้ รหัสที่ถูกแบ่งเป็นส่วนย่อยนี้จะถูกเก็บกระจายไปยัง Storage, Nodes, หรือแม้แต่คนละภูมิภาค การกู้คืนและสร้างข้อมูลที่เสียหายกลับมาด้วยเทคนิคนี้เรียกว่า Oversampling
- Flat backup เป็นการปกป้องข้อมูลซึ่งทำการสำเนาสแน็ปช็อตและถูกย้ายไปยังที่จัดเก็บข้อมูลราคาประหยัด (low-cost storage) โดยไม่ต้องใช้ซอฟต์แวร์สำรองข้อมูลแบบเดิม สแน็ปช็อตดั้งเดิมจะคงอยู่ที่เดิม ในขณะที่สำเนาสำรองข้อมูลแบบ Flat backup จะถูกเรียกใช้งานหากต้นฉบับไม่พร้อมใช้งานหรือใช้งานไม่ได้
- Mirror เป็นการวางไฟล์ข้อมูลไว้บนคอมพิวเตอร์เซิร์ฟเวอร์มากกว่าหนึ่งเครื่องหรือเก็บข้อมูลลงใน Disk/Storage คนละชุดเพื่อให้แน่ใจว่าผู้ใช้ยังคงสามารถเข้าถึงได้ในกรณีที่เกิดปัญหา ในการ Synchronous Mirroring ข้อมูลจะถูกเขียนไปยังที่จัดเก็บสองชุดพร้อมกัน การเขียนจากที่จัดเก็บชุดแรกจะไม่ได้รับการรับรู้จนกว่าจะมีการยืนยันถูกส่งจากที่จัดเก็บข้อมูลอีกชุดนึง ดังนั้น ระบบจะตรวจสอบให้แน่ใจว่าข้อมูลทั้งสองชุดมีสำเนาข้อมูลที่เหมือนกัน สำหรับการทำ Asynchronous Mirroring ข้อมูลจะถูกเขียนไปยังที่จัดเก็บสองชุดพร้อมกันแต่ระบบจะรับรู้เมื่อการจัดเก็บข้อมูลชุดแรกเรียบร้อย โดยไม่รอการจัดเก็บข้อมูลชุดที่สอง
- Replication สามารถใช้ให้ผู้ใช้สามารถเลือกจำนวนชุดข้อมูลสำเนาที่ต้องการของข้อมูลที่จำเป็นต่อการดำเนินธุรกิจ การ Replicate ข้อมูลจะคัดลอกข้อมูลจากที่หนึ่งไปยังอีกที่หนึ่ง โดยให้สำเนาที่เป็นปัจจุบันและมีข้อมูลเหมือนกันเพื่อประโยชน์ในแง่การกู้คืนข้อมูล

- Recovery-in-place หรือ Instant Recovery ทำให้ผู้ใช้สามารถเรียกใช้แอปพลิเคชันที่ใช้งานจริงได้ชั่วคราวโดยตรงจากข้อมูลที่ทำการสำรองโดยตรง ดังนั้น ความพร้อมใช้งานของข้อมูลสำหรับการกู้คืนข้อมูลจึงมีอย่างสูงและสามารถกู้คืนมาใช้งานได้อย่างรวดเร็ว การดึงข้อมูลจากระบบเซิร์ฟเวอร์สำรองข้อมูลหรือ Storage สามารถช่วยให้การกู้คืนทำได้ระบบภายในไม่กี่นาที แต่การกู้คืนจากอิมเมจที่ถูกสำรองข้อมูลที่ต่อเชื่อมจะทำให้ประสิทธิภาพลดลง เนื่องจากเซิร์ฟเวอร์สำรองข้อมูลอาจจะไม่ได้มีขนาดหรือประสิทธิภาพเพื่อรองรับปริมาณงานจริง

- Storage Snapshot คือการจัดเก็บข้อมูลจากช่วงเวลาที่กำหนดบนดิสก์สำหรับฐานข้อมูล ไฟล์ หรือ Disk Volumeที่เก็บข้อมูลที่กำหนดของ Storage ผู้ใช้สามารถอ้างถึงช่วงเวลาที่ทำการสำรองพื่อกู้คืนข้อมูลจากจุดที่เลือกได้ในลักษณะ Point-in-time Recovery การทำ Snapshot ไม่ใช่การสำรองข้อมูล Full Backup ทั้งหมด ด้วยเหตุนี้ Snapshot จึงไม่ป้องกันข้อมูลสูญหายจากฮาร์ดแวร์เสียหาย โดยทั่วไป Snapshot จะถูกจัดกลุ่มเป็นสามประเภท: Changed Block, Clones และ CDP
วิธีเลือกการสำรองข้อมูลที่เหมาะสม
เมื่อตัดสินใจว่าจะใช้การสำรองข้อมูลประเภทใด คุณต้องชั่งน้ำหนักข้อควรพิจารณาสำคัญหลายประการ
องค์กรมักผสมผสานวิธีการสำรองข้อมูลต่างๆ ตามความต้องการขององค์กร โดยกำหนดกลยุทธ์การสำรองข้อมูลภายใต้ SLA ที่ใช้กับแอปพลิเคชันหรือระบบนั้นๆ ทั้งในส่วนที่เกี่ยวกับการเข้าถึงข้อมูลและความพร้อมใช้งาน วัตถุประสงค์ด้านเวลาการกู้คืน (RTO) และวัตถุประสงค์ของจุดกู้คืน (RPO) ทางเลือกของการสำรองข้อมูลยังขึ้นอยู่กับความสามารถของแอปพลิเคชั่นสำรองข้อมูล ซึ่งควรรับประกันว่าข้อมูลทั้งหมดจะได้รับการสำรองข้อมูลและให้การ Replication และการกู้คืน ในขณะที่สามารถสร้างกระบวนการสำรองข้อมูลที่มีประสิทธิภาพ