Recuperación de Datos de NAS Synology DS920+ y Serie DS
Los NAS Synology de la serie DS —DS920+, DS720+, DS1621+, DS418play— son soluciones de almacenamiento muy extendidas en pymes y hogares avanzados. Cuando el volumen se degrada, DSM no arranca o uno o más discos fallan, los datos pueden quedar totalmente inaccesibles. Un laboratorio especializado puede recuperarlos mediante técnicas de reconstrucción de RAID por software y análisis de sistemas de ficheros Btrfs y ext4.
Arquitectura de almacenamiento en los NAS Synology DS
Antes de entender cómo se produce la pérdida de datos, conviene conocer cómo Synology organiza el almacenamiento internamente. Todos los modelos de la serie DS utilizan Linux como base del sistema operativo DSM (DiskStation Manager), lo que implica una arquitectura de almacenamiento totalmente diferente a la de un servidor Windows o un NAS de gama baja.
Los componentes clave son:
- md (Linux Software RAID): Synology utiliza el subsistema
mdde Linux para gestionar la redundancia entre discos. Cada volumen aparece como/dev/md0,/dev/md1, etc. Sobre este nivel opera la gestión de la redundancia entre los discos físicos. - LVM (Logical Volume Manager): Sobre el RAID software se construye un grupo de volúmenes LVM (
vg1), y sobre él un volumen lógico (volume1). Esta capa añade flexibilidad pero también complejidad en la recuperación. - Sistema de ficheros: Los modelos modernos (DSM 6.x en adelante en hardware compatible) usan Btrfs como sistema de ficheros por defecto. Los modelos más antiguos o configuraciones heredadas emplean ext4. Btrfs ofrece instantáneas (snapshots), checksums por bloque y auto-reparación, pero su estructura interna es más compleja de reconstruir manualmente.
Qué es SHR (Synology Hybrid RAID) y por qué complica la recuperación estándar
SHR es el nivel de RAID propietario de Synology. A diferencia de RAID 1, 5 o 6 estándar, SHR calcula la distribución de paridad de forma dinámica según los tamaños de los discos instalados. Esto permite mezclar discos de diferentes capacidades obteniendo la máxima redundancia posible, algo que no es posible con RAID 5 convencional.
Internamente, SHR sigue siendo md de Linux —es decir, RAID 1, 5 o 6 estándar a nivel de bloques— pero la geometría de la distribución depende de las capacidades reales de cada disco. Esto significa que un conjunto SHR no puede montarse directamente en otro sistema Linux sin conocer exactamente la geometría utilizada. Los superblocks de md almacenan metadatos críticos del array: si están dañados o son contradictorios, el sistema no puede ensamblar el array automáticamente.
En un array SHR de 4 bahías como el DS920+, puede haber hasta dos niveles de paridad distintos aplicados a subconjuntos diferentes de los discos. Nuestro laboratorio dispone de herramientas y procedimientos documentados para reconstruir geometrías SHR manualmente a partir del análisis de los superblocks y los patrones de datos en los discos, sin necesidad de que el array se ensamble automáticamente.
Escenarios de fallo más frecuentes en Synology DS920+ y serie DS
1. Volumen degradado por fallo de uno o varios discos
El escenario más común es el fallo de uno de los discos del array mientras el NAS sigue operativo. DSM pasa el volumen a estado “degradado” y puede seguir funcionando si la configuración tiene suficiente redundancia. El problema surge cuando el disco de repuesto no llega a tiempo y falla un segundo disco, cuando el proceso de reconstrucción del array fuerza la lectura intensiva del resto de discos provocando que un disco en mal estado acabe fallando, o cuando se instala un disco de repuesto incompatible —por ejemplo, un disco SMR en un array previamente CMR— y la reconstrucción fracasa.
2. Corrupción del sistema operativo DSM
DSM se instala en una partición separada de los discos de datos. En el DS920+ y modelos similares de 4+ bahías, el sistema operativo reside en particiones dedicadas de todos los discos del array (/dev/sda1, /dev/sdb1, etc.), formando un RAID 1 interno. Si esta partición de sistema se corrompe —por un corte de luz durante una actualización de DSM, por ejemplo— el NAS no arranca, pero los datos del volumen de datos pueden estar completamente intactos.
La recuperación en este caso pasa por extraer los discos, montar el array de datos directamente en un sistema Linux de laboratorio y acceder al volumen Btrfs o ext4 directamente, sin necesidad de que DSM funcione.
3. Corrupción del sistema de ficheros Btrfs
Btrfs es un sistema de ficheros copy-on-write (CoW). Cada escritura genera una nueva versión del bloque modificado, y el árbol de metadatos se actualiza atómicamente. Esto lo hace muy resistente a la corrupción, pero no inmune. Los fallos de Btrfs suelen producirse por cortes de alimentación durante escrituras masivas, errores de hardware que pasan los checksums pero introducen datos incorrectos, o superblocks de Btrfs dañados (hay 4 copias del superbloque en cada dispositivo). Existen también casos de árboles de metadatos Btrfs (chunk tree, extent tree, fs tree) inconsistentes que impiden el montaje del volumen.
La herramienta btrfs check --repair puede agravar la corrupción si se usa sin precaución. Nuestro laboratorio siempre trabaja sobre imágenes de disco completas, nunca sobre los originales.
4. Cifrado de volumen (eCryptfs / LUKS)
Si el volumen del NAS estaba cifrado con la opción de cifrado de Synology (basada en eCryptfs en DSM 6 o LUKS en DSM 7), la recuperación requiere la clave de cifrado o la contraseña de la clave exportada (.key). Sin esta información, la recuperación de datos legibles es imposible desde el punto de vista técnico. Si tiene el volumen cifrado y recuerda la contraseña o conserva el archivo .key exportado desde DSM, la recuperación es posible aunque el array esté dañado. Contáctenos indicando esta circunstancia desde el primer momento.
Proceso de recuperación en laboratorio para NAS Synology
Cuando recibimos un NAS Synology con volumen inaccesible, el proceso estándar comprende las siguientes fases:
- Diagnóstico de los discos individuales: Cada disco se conecta a nuestra estación de imágenes y se evalúa su estado de salud mediante S.M.A.R.T., tasa de errores de lectura y sectores reasignados. Los discos con sectores defectuosos se clonan primero mediante herramientas de imaging forense que gestionan los errores sin detener el proceso.
- Creación de imágenes de trabajo: Trabajamos siempre sobre imágenes bit a bit, no sobre los discos originales. Esto garantiza que podemos repetir intentos sin dañar los soportes originales.
- Análisis de los superblocks de md: Extraemos los metadatos del array Linux RAID para determinar la geometría exacta: nivel de RAID, tamaño de chunk, orden de los discos y estado de cada superblock.
- Reconstrucción del array: Si los superblocks son coherentes, ensamblamos el array en modo solo-lectura. Si están dañados o son contradictorios, reconstruimos la geometría manualmente a partir del análisis de patrones en los datos en bruto.
- Acceso al volumen LVM: Sobre el array reconstruido activamos el grupo de volúmenes LVM y montamos el volumen lógico de datos.
- Extracción de datos del sistema de ficheros: Montamos el volumen Btrfs o ext4. Si el montaje falla por corrupción, usamos herramientas especializadas de reconstrucción de árboles Btrfs o extundelete para ext4.
- Listado y selección: Enviamos al cliente un listado de los archivos recuperables para su validación antes de la entrega final.
Tasas de éxito según el tipo de fallo
| Tipo de fallo | Tasa de éxito estimada | Observaciones |
|---|---|---|
| Fallo de 1 disco en SHR/RAID 5 | 95-99% | Recuperación completa si el resto de discos están sanos |
| Fallo de 2 discos en SHR2/RAID 6 | 90-95% | Depende del estado de los discos restantes |
| Corrupción DSM (datos intactos) | 95-99% | Acceso directo al volumen sin necesidad de DSM |
| Corrupción Btrfs parcial | 75-90% | Archivos en zonas no corruptas se recuperan al 100% |
| Fallo de 2 discos en SHR/RAID 5 | 0-40% | Sin redundancia suficiente; depende de solapamiento de errores |
Qué hacer (y qué no hacer) antes de enviar su NAS
No haga esto:
- No intente reparar el volumen desde la interfaz DSM usando la opción de reparación automática si hay más de un disco degradado.
- No realice un reset de fábrica del NAS. Puede dificultar la recuperación aunque no borra los datos del volumen.
- No instale un disco de repuesto sin antes hacer una imagen de los discos supervivientes si el array ya está dañado.
- No conecte y desconecte los discos repetidamente. Cada ciclo de arranque con un array dañado puede sobrescribir metadatos críticos.
Haga esto:
- Apague el NAS inmediatamente cuando DSM muestre alertas de volumen crítico o fallo de disco.
- Anote el estado que mostraba DSM antes del apagado: volumen degradado, crash, error de disco concreto.
- Envíe todos los discos del array juntos, etiquetados con su posición en las bahías (Disco 1, Disco 2, etc.).
- Si tiene cifrado activo, incluya la contraseña o el archivo .key exportado desde DSM.
Modelos Synology compatibles con nuestro servicio
Recuperamos datos de toda la gama de NAS Synology, incluyendo:
- Serie DS de 2 bahías: DS720+, DS723+, DS220+, DS218+, DS218play
- Serie DS de 4 bahías: DS920+, DS923+, DS420+, DS418, DS418play
- Serie DS de 6 bahías: DS1621+, DS1621xs+, DS620slim
- Serie DS de 8 bahías: DS1821+, DS1823xs+, DS1819+
- Serie RS (Rack Station): RS1221+, RS820+, RS820RP+
- Serie XS y XS+: DS3622xs+, DS2422+
También trabajamos con dispositivos Synology más antiguos bajo DSM 5.x y 6.x con sistemas de ficheros ext4 o ext3.