Disponer de tecnologías que optimicen el almacenamiento, el envío y la seguridad de la información se ha convertido hoy en día en un factor clave para las empresas, que manejan, cada vez más, un mayor volumen de datos para desarrollar su actividad. Soluciones como la deduplicación pueden ser muy útiles a la hora de optimizar al máximo los recursos empleados en estas tareas. Pero, ¿qué es la deduplicación y qué ventajas puede aportar? ¿Por qué se ha convertido en un elemento imprescindible a la hora de planificar la arquitectura TI de una empresa?
La deduplicacion es una técnica especializada de compresión de datos consistente en eliminar bloques de datos duplicados cuando se realizan y se transfieren copias de seguridad. Disminuye las necesidades de almacenamiento y mejora la eficiencia del ancho de banda de la red, al guardar y transmitir tan solo aquellos datos que son útiles para la organización y desechando los repetidos.
¿Cómo funciona?
Con la aplicación de la deduplicación, los datos se guardan la primera vez, registrando en los siguientes procesos de backup solo los cambios y generando un enlace o indicador de las copias. Al almacenar menos información, ésta se gestiona con mayor facilidad- se reducen la velocidad de copiado en los backup diarios y los tiempos- y se agiliza el proceso de recuperación de datos. Esta fluidez contribuye también a reducir el riesgo de procesos fallidos y datos corruptos, lo que es fundamental en estos tiempos en los que el volumen de información que mueven las empresas se incrementa de forma exponencial y es conveniente extremar las precauciones para no sufrir pérdidas de información.
La deduplicación se puede llevar a cabo en origen o en destino y, en este último caso, puede desarrollarse inline u offline.
La deduplicación en origen consiste en la comparación de los bloques de información que ya se han respaldado con los que se van a respaldar, evitando el envío de bloques duplicados al sistema de destino y generando que la transmisión de información entre los sistemas de origen y destino sea mínima. Esto es fundamental en arquitecturas de backup que funcionan sobre redes lentas (ADSL, redes móviles, etc.).
· La deduplicación en destino se ejecuta en los recursos del sistema del destino –software o hardware-. Esta deduplicación recibe el dato y lo compara con los que ya han sido almacenados para eliminar bloques duplicados. Este sistema puede combinarse con un proceso de compresión, mejorando así las tasas de ahorro de almacenamiento. Este tipo de deduplicación suele ser muy interesante en arquitecturas con elevadas velocidades de transmisión.
Tipos de deduplicación:
- Deduplicación a nivel de archivo
Este sistema compara el archivo que va a ser objeto del backup con aquellos que ya han sido almacenados analizando sus atributos y cotejándolos con el índice creado previamente. Si el archivo es nuevo, se realiza la copia de seguridad y se actualiza el índice, pero si solo es una nueva versión, solamente cambiarán aquellos atributos que hayan sufrido variaciones y se almacenarán como un puntero a cada uno de los segmentos del contenido de la copia única del archivo. - Deduplicación a nivel de bloque
Separa la información en bloques que serán analizados para buscar redundancias con respecto a los ya almacenados con anterioridad. Este tipo de deduplicación está especialmente indicada para el almacenamiento y backup de grandes ficheros
Ventajas:
- Ayuda a racionalizar la creación de copias de seguridad
- Permite disponer de un sistema centralizado de copias de respaldo
- Reduce el espacio de almacenamiento al guardar solo datos únicos.
- Disminuye los costes de electricidad y ancho de banda, al transmitir solo aquellos datos únicos.
- Supone un ahorro en discos virtuales, gracias al aprovechamiento del espacio de almacenamiento y a la reducción del número de copias de seguridad necesarias.
En conclusión, la deduplicación es una tecnología muy a valorar si nuestra empresa necesita disponer de procesos de backup ágiles y eficaces. ¿Cuál es tu experiencia?