Respaldos

Publicado el 02/09/2024

¿Qué es un respaldo?

Fue en noches de carnaval que escuchamos al pasar la pregunta de aquel niño: ¿qué es un respaldo, mamá?

En informática, llamamos respaldo a una copia de la totalidad o parte de los datos contenidos en uno o varios computadores. El respaldo deberá permanecer invariable, y su contenido tiene que poder ser accedido posteriormente para consulta y recuperación.

¿Para qué sirve un respaldo?

Un buen respaldo debería asegurarnos la continuidad de nuestras operaciones tras sufrir algún tipo de pérdida de información. Esto va desde borrar accidentalmente un archivo hasta una catástrofe mayor como puede ser un robo o incendio. Básicamente, si perdemos el acceso a un PC y lo reemplazamos por otro nuevo, deberíamos poder restaurar los sistemas, aplicaciones, datos y configuración que contenía el PC original.

¿Qué respaldar?

Todo lo que necesitemos para cumplir con el punto anterior. Documentos, imágenes, bases de datos, agendas, favoritos de internet, correos, archivos de configuración de las aplicaciones, etc. También debemos respaldar los datos contenidos en la nube, tanto si es una nube propia de la empresa como si es un servicio tercerizado (Dropbox, Google, Microsoft, Apple, etc).

Hoy en día solemos tener el ordenador y el móvil sincronizados, de manera que datos como la agenda o nuestra galería de fotos se duplican en ambos dispositivos. Esto no es necesariamente un respaldo desde el momento en que si borro un contacto o una foto de un dispositivo, el otro también lo elimina. Como habíamos aclarado al principio, los respaldos deben permanecer inmutables.

También deberíamos contar con los instaladores y licencias de los programas que usamos, ya sea las aplicaciones que se instalan localmente, como también los sistemas operativos.

En el caso de servidores virtuales, se respalda una imagen de máquina virtual y su disco. En caso de una falla en el servidor físico, no debería tomar demasiado tiempo levantar la máquina virtual respaldada en otro servidor y recuperar los archivos de datos desde el respaldo.

Políticas de respaldo

Principalmente para el caso de empresas, es buena práctica tener definidas políticas claras de respaldo. Esta políticas deberían establecer con claridad el tipo de información que se respaldará, pudiéndose especificar además la que no se incluirá. Por ejemplo, es bastante común que se guarden archivos personales en las PC de una oficina: documentación personal escaneada, fotos de las vacaciones, música, etc. Más allá de si esta debería ser una práctica permitida o no, es claro que sucede y de manera bastante frecuente. Por esto es necesario que la política de respaldo especifique qué sucede con información que no es relevante para el funcionamiento de la empresa, dejando claro si se incluye o no en los respaldos.

Medios de respaldo

El medio sobre el cual se almacena el respaldo es algo que dependerá de múltiples factores tales como el volumen de información a respaldar, el costo de los medios de respaldo y el avance tecnológico. Cuando yo daba mis primeros pasos en el mundo de las TI, el medio de respaldo por excelencia eran las cintas, luego fueron los ZIP Disks, los CD, DVD… y así hasta hoy en 2024 que es mucho más común la utilización de discos externos, sin duda motivado por su bajo costo por byte y su practicidad para manejo y almacenamiento.

Por otro lado, si necesitamos respaldar un bajo volumen de datos, los pendrives siguen siendo una opción simple y de bajo precio, además de los servicios de almacenamiento en la nube.

Tipos de respaldos

Luego de determinar qué archivos se van a respaldar, debemos decidir qué método de respaldo utilizar. Se diferencian en la forma en que actualizan la información contenida en los respaldos y, sin bien existen cerca de una decena de métodos, vamos a tratar los tres más comunes.

Respaldo completo

Este es el respaldo que más tiempo consume, pero también el más seguro. Cada vez que se hace un respaldo completo, se copian la totalidad de los datos elegidos para su resguardo. Si necesitamos recuperar los datos, bastará contar con el último respaldo realizado sin errores.

Respaldo diferencial

En este método, se elige un día de la semana o mes para realizar un respaldo completo y el resto del tiempo se realiza una copia solamente de los archivos modificados desde el último respaldo completo. Esto tiene la ventaja de ser más rápido pero implica que, para restaurar la información, necesitaremos el medio con el respaldo completo y el del último respaldo diferencial.

Respaldo incremental

Este es el método más rápido de todos. Al igual que con el respaldo diferencial, se debe realizar un respaldo completo pero luego cada respaldo incremental copia únicamente los datos que variaron desde el respaldo anterior, sea o no un respaldo completo. El inconveniente que acarrea este método es que, al momento de hacer una restauración, necesitaremos el último respaldo completo más cada uno de los respaldos posteriores.

Un ejemplo práctico

Vamos a suponer que todas las noches hacemos un respaldo y que utilizamos un disco distinto para cada día de la semana, de lunes a viernes. Supongamos además que el jueves se nos rompe el disco duro de un PC y lo sustituimos por uno nuevo.

Si hacemos respaldos completos, nos bastará con recuperar el último respaldo desde el último medio utilizado para respaldar.

Si utilizamos el método de respaldo diferencial, realizando un respaldo completo los viernes, vamos a necesitar el último respaldo completo y el último respaldo diferencial. Es decir, los respaldos del viernes (completo) y miércoles (diferencial).

Pero si habíamos elegido usar el método de respaldo incremental, vamos a requerir el respaldo completo y todos los respaldos incrementales de cada día de la semana, anteriores a la rotura del disco duro del ordenador (viernes, lunes, martes y miércoles).

¿Cuántas copias realizar?

Existe un estándar sugerido que se conoce como 3-2-1. Esto significa que, por cada respaldo, se realizan 3 copias en 2 medios diferentes, con 1 copia almacenada fuera del edificio donde residen los datos originales. Esto último es para que si ocurre, por ejemplo, un incendio en la oficina, no se pierdan también los respaldos.

Obviamente que el 3-2-1 no es una regla de oro, pero en lo personal sí recomiendo encarecidamente que al menos un set de copias se guarden fuera de las oficinas.

Frecuencia de los respaldos

Tengamos en cuenta que al recuperar un archivo desde un respaldo, se pierde lo que hayamos modificado con posterioridad a la copia. La cantidad de información en riesgo siempre va a depender de la frecuencia con la que realizamos los respaldos.

Si podemos volver a realizar el trabajo de una mañana o tarde sin mayores inconvenientes, un respaldo a la noche y otro al mediodía podría ser nuestra solución. Por otro lado, un respaldo diario implicaría que, a lo sumo, podemos llegar a perder un día completo de trabajo.

Cuanto menos información estemos dispuestos a perder, mayor frecuencia de respaldos y también, mayor costo y mayor tiempo en que los sistemas se encontraran respaldando, lo que puede ocasionar demoras en el funcionamiento general de las aplicaciones.

También debemos considerar si realmente es necesario respaldar un dato con demasiada frecuencia. Un archivo que sabemos que se va a modificar un día al mes tal vez no requiera ser respaldado diariamente.

Histórico de respaldos

¿Por cuánto tiempo deben mantenerse los respaldos? Depende de que tan atrás en el tiempo vamos a querer recuperar los datos y de lo que es legal mantenerlos.

Supongamos que hoy notamos un archivo corrupto y necesitamos recuperarlo desde un respaldo. Procedemos a levantar el último respaldo y nos damos cuenta de que el archivo ya estaba corrupto cuando se respaldo la última vez. Procedemos entonces a revisar el penúltimo respaldo y resulta que también estaba corrupto el archivo. Seguramente se trata de un archivo al que accedemos poco, por ejemplo una planilla de sueldos a la que accedemos una vez al mes. La pregunta entonces es hasta qué punto en el tiempo el archivo nos sería de utilidad? Un mes atrás podría ser todavía útil, pero un año antes tal vez ya no nos sirve y estamos ocupando un medio de almacenamiento con información que ya caducó.

También pueden existir limitantes legales al tiempo que ciertos datos personales pueden ser conservados, y esto obviamente abarca a los respaldos.

Seguridad de los respaldos

Los respaldos deben ser tratados con la importancia que la información contenida requiere. Consideren que allí se encuentra la información privada y secreta nuestra o de la empresa.

Deben ser almacenados en un lugar seguro, de ser posible con acceso restringido, y los datos deben estar cifrados. De este modo, si alguien se hiciese con nuestros respaldos, necesitará una contraseña para desencriptarlos.

Automatización y comprobación

Existen distintas opiniones acerca de si los respaldos deben ser automáticos o manuales, con argumentos a favor y en contra para ambas posturas. Les voy a dar mi opinión personal a este respecto.

Para un hogar o pequeño negocio, los respaldos manuales creo que son los más convenientes por su bajo costo y mayor control de cada operación. También es recomendable la creación de un script que copie los diferentes archivos y carpetas que nos interesan, pero el cual lanzaremos manualmente. La ventaja de un respaldo manual es que podemos ver en tiempo real si se produce algún fallo y actuar en consecuencia.

Para empresas, recomiendo automatizarlos pero estableciendo una rutina periódica para comprobar su correcto funcionamiento. Dicha rutina debe incluir la comprobación de los logs de respaldo en busca de alertas y errores, como así también intentar recuperar algún archivo aleatorio (diferente todas las veces) para comprobar que el respaldo es legible y la información puede ser accedida sin inconvenientes. Los respaldos programados permitirán ser realizados en horarios en que haya poca o ninguna actividad en la empresa.

Plan de contingencia

Además de las políticas de respaldo, se deben documentar los métodos para actuar en caso de que algún problema requiera la recuperación de los datos respaldados. El plan debe incluir una persona o puesto que tomará las decisiones al respecto de si aplica proceder con una restauración o si, por el contrario, la avería es recuperable sin necesidad de recurrir a los respaldos.

El plan de contingencia también debe especificar con claridad la prioridad de recuperación. Cuando se produce una falla en varios sistemas al mismo tiempo, todos los departamentos afectados querrán tener prioridad uno para volver a estar operativos, lo cual es impracticable. La prioridad debe acordarse previamente con la gerencia y/o dirección de la empresa.

Destrucción de respaldos

Finalmente, habrá momentos en que deberemos deshacernos de un set de respaldos, bien porque la información que contiene ya no es necesaria, o bien porque el medio físico ha alcanzado el final de su vida útil.

Lo recomendable es realizar un borrado seguro (se reescriben los medios con datos aleatorios) y/o destruir el medio físico. Las cintas se queman, los medios ópticos se rompen y a los discos duros se les perforan los platos con un taladro. Drástico sí, pero también irrecuperable.

Conclusión

Los respaldos son una parte fundamental de cualquier estrategia de seguridad informática, tanto para individuos como para empresas. Este artículo ha abordado los aspectos clave de los respaldos, desde su definición y propósito hasta las mejores prácticas para su implementación y gestión.

Hemos explorado qué información debe respaldarse, los diferentes tipos de respaldos (completo, incremental y diferencial), y la importancia de establecer políticas claras de respaldo. También se han discutido los diversos medios de almacenamiento disponibles y la regla 3-2-1 para la redundancia de copias.

También destacamos la relevancia de determinar la frecuencia adecuada de los respaldos, mantener un histórico apropiado, y garantizar la seguridad de la información respaldada. Además, se han abordado temas como la automatización de los procesos de respaldo, la necesidad de comprobar regularmente la integridad de las copias, y la importancia de contar con un plan de contingencia.

Finalmente, se ha enfatizado la necesidad de una destrucción segura de los respaldos obsoletos para proteger la información sensible.

En resumen, los respaldos son una medida de seguridad crítica que requiere una planificación cuidadosa, implementación consistente y revisión regular para garantizar la protección efectiva de los datos y la continuidad de las operaciones en caso de pérdida de información.