Te puede interesar
RAID 5 con Dos Discos Fallidos: ¿Se Pueden Recuperar los Datos?
Un RAID 5 está diseñado para sobrevivir al fallo de un único disco. Cuando falla un segundo disco antes de completar la reconstrucción, el array pierde toda su información de paridad y los datos quedan inaccesibles. Sin embargo, con las técnicas forenses adecuadas, la recuperación es posible en muchos casos. En este artículo explicamos los mecanismos del RAID 5, los riesgos reales y el protocolo que seguimos en nuestro laboratorio de Barcelona.
Por qué el RAID 5 no tolera dos fallos simultáneos
El RAID 5 distribuye los datos y un bloque de paridad XOR entre todos los discos del array. Con N discos, la paridad de cualquier stripe es la operación XOR de los N−1 bloques de datos. Esto permite reconstruir cualquier disco fallido. El problema es que esta ecuación tiene dos incógnitas cuando fallan dos discos: no hay suficiente información algebraica para resolverla sin datos externos.
El escenario más frecuente no es el fallo instantáneo de dos discos, sino el fallo durante la reconstrucción. Cuando se sustituye el primer disco averiado, la operación de rebuild lee intensivamente todos los discos restantes. Si alguno tiene sectores defectuosos latentes —URE (Unrecoverable Read Errors)— el proceso se interrumpe y el array queda en degradado doble.
La probabilidad de encontrar un URE en un disco de 4 TB es estadísticamente significativa: los discos de consumo especifican 1 URE cada 1014 bits leídos (unos 12,5 TB). Un rebuild de un RAID 5 de 5 discos de 4 TB supone leer ∼16 TB, por lo que la probabilidad de toparse con al menos un URE roza el 70 %.
RAID 5 vs RAID 6: diferencias de tolerancia a fallos
El RAID 6 extiende el concepto de paridad a dos bloques independientes (P y Q) calculados con algoritmos distintos (XOR y Reed-Solomon). Esto permite reconstruir el array incluso con dos discos fallidos simultáneamente. La penalización es mayor overhead de CPU y la necesidad de al menos cuatro discos.
| Nivel RAID | Discos mínimos | Fallos tolerados | Espacio útil |
|---|---|---|---|
| RAID 5 | 3 | 1 | (N−1)/N |
| RAID 6 | 4 | 2 | (N−2)/N |
| RAID 1+0 | 4 | 1 por espejo | 50 % |
| RAID 5E | 4 | 1 + hot spare | (N−2)/N |
Si tu entorno no puede permitirse tiempo de inactividad, la transición a RAID 6 o a una arquitectura con hot spare es la recomendación estándar tras una recuperación.
Protocolo de imagen forense antes de cualquier reconstrucción
El error más frecuente es intentar reconstruir el array directamente con los discos dañados. Cada lectura sobre un disco con sectores inestables puede provocar nuevos errores o hacer que el disco deje de responder. El protocolo correcto es:
- Apagar el NAS o servidor inmediatamente al detectar el segundo fallo. No intentar montar el array.
- Clonar cada disco por separado mediante herramientas especializadas (ddrescue, DC3DD, hardware duplicators como DeepSpar o PC-3000), sector a sector, registrando cada error de lectura.
- Trabajar siempre sobre las imágenes, nunca sobre los discos originales, que quedan guardados como copia de seguridad.
- Analizar los metadatos del array: superbloque RAID (mdadm), configuración del controlador (LSI, Adaptec, Intel RST) o configuración del NAS.
- Reconstruir el array virtualmente en software sin escribir ningún dato en los discos originales.
Este protocolo minimiza el riesgo de pérdida permanente y aumenta significativamente las probabilidades de éxito.
Parámetros críticos: chunk size, orden de discos y rotación de paridad
Para reconstruir un RAID 5 virtualmente, es imprescindible conocer con exactitud tres parámetros:
- Chunk size: normalmente 64 KB, 128 KB o 256 KB según el controlador. Un valor erróneo produce datos completamente corruptos.
- Orden de los discos: qué posición ocupa cada disco en el stripe. Si se desconoce, se prueba por fuerza bruta con todas las permutaciones posibles.
- Rotación de paridad: left-synchronous, left-asynchronous, right-synchronous o right-asynchronous. Determina en qué disco reside el bloque de paridad de cada stripe.
Los NAS domésticos (Synology, QNAP, Netgear ReadyNAS) usan mdadm de Linux, que almacena el superbloque en los últimos sectores de cada disco, con el UUID del array, versión del layout, chunk size y mapa de dispositivos.
Herramientas especializadas: R-Studio, UFS Explorer y ReclaiMe
Una vez obtenidas las imágenes, la reconstrucción virtual se realiza con software forense especializado:
- R-Studio RAID: permite definir manualmente todos los parámetros del array, probar combinaciones y previsualizar el sistema de archivos antes de extraer datos. Compatible con NTFS, ext4, XFS, APFS.
- UFS Explorer RAID Recovery: especialmente bueno con NAS Synology y QNAP. Detecta automáticamente parámetros mdadm y soporta Btrfs.
- ReclaiMe Free RAID Recovery: herramienta gratuita para determinar parámetros RAID cuando se desconocen. Útil como primer paso diagnóstico.
- PC-3000 RAID (hardware): solución profesional de ACE Laboratory. Trabaja con discos con daños físicos, sectores inestables y placas electrónicas averiadas.
En nuestro laboratorio combinamos PC-3000 para la clonación con R-Studio y UFS Explorer para la reconstrucción lógica del array.
Recuperación en NAS Synology, QNAP y Netgear ReadyNAS
Los NAS de consumo y pequeña empresa presentan particularidades importantes:
- Synology DSM: usa mdadm con superbloque v1.0 al final del disco. El volumen suele ser LVM sobre el array RAID con ext4 o Btrfs. El Btrfs de Synology tiene checksums de metadatos que pueden dificultar la recuperación si hay corrupción parcial.
- QNAP QTS: también usa mdadm, pero con particionado diferente. Hay que distinguir entre los discos del pool de almacenamiento y los del sistema operativo.
- Netgear ReadyNAS: los modelos antiguos usaban X-RAID con ext3, los modernos usan BTRFS nativo. Los modelos Business (RN3000, RN4000) usan mdadm convencional.
En todos los casos, si el NAS se enciende y detecta el array degradado, puede intentar una reconstrucción automática que empeore la situación. Recomendamos extraer los discos y no encender el NAS hasta consultar con un especialista.
Precios de recuperación de RAID 5 con dos discos fallidos
El coste depende del número de discos, su capacidad, el estado físico y la complejidad del sistema de archivos:
| Caso | Descripción | Precio orientativo |
|---|---|---|
| RAID 5 (3-4 discos), fallo lógico | Discos físicamente correctos, parámetros conocidos | 500 – 900 € |
| RAID 5 (3-4 discos), sectores dañados | Clonación previa necesaria, parámetros recuperables | 900 – 1.500 € |
| RAID 5 (5-6 discos), fallo mixto | Parámetros desconocidos, sistema de archivos complejo | 1.500 – 2.500 € |
| RAID 5 empresarial (>6 discos) | Controlador hardware averiado + daños físicos | 2.500 – 3.000 € |
Todos los presupuestos son gratuitos y sin compromiso. Sólo cobramos si recuperamos los datos.