Recuperar datos de RAID 6: fallo de 3 o más discos [2026]
Equipo Técnico RecuperaTusDatos — — 11 min de lectura
RAID 6 es la configuración RAID más robusta para entornos empresariales: tolera el fallo simultáneo de dos discos gracias a su doble paridad P y Q basada en el algoritmo de Reed-Solomon. Pero cuando un tercer disco falla, el sistema matemático de recuperación queda con más incógnitas que ecuaciones y el volumen se vuelve completamente inaccesible. No es una pérdida definitiva — el laboratorio puede recuperar los bloques que no involucran los tres sectores perdidos simultáneamente — pero las tasas de éxito son inferiores a las de otros escenarios RAID y el proceso es significativamente más complejo y costoso.
- Tolerancia de diseño: Exactamente 2 fallos simultáneos (paridad P+Q)
- Con 3 fallos: Pérdida de acceso total al volumen — requiere laboratorio forense
- Recuperación parcial: Posible si los bloques perdidos no se solapan en todos los discos fallidos
- Tasa de éxito en laboratorio: 45–75 % según número de discos supervivientes y tipo de fallo
- Coste estimado: 2.000–6.000 € + IVA
- Plazo estimado: 10–25 días laborables
- Diagnóstico: Gratuito y sin compromiso
1. Arquitectura RAID 6: paridad P+Q y algoritmo de Reed-Solomon
RAID 6 extiende la arquitectura de RAID 5 añadiendo un segundo bloque de paridad independiente en cada fila del stripe. Estos dos bloques se denominan convencionalmente P y Q. La paridad P es idéntica a la de RAID 5: XOR simple de todos los bloques de datos de esa fila. La paridad Q es diferente: se calcula usando el algoritmo de Reed-Solomon sobre aritmética de campo de Galois GF(28), lo que le confiere propiedades matemáticas que el XOR simple no tiene.
Reed-Solomon es el mismo código de corrección de errores que se usa en CDs, DVDs, comunicaciones por satélite y QR codes. En el contexto RAID, permite resolver un sistema de ecuaciones donde P y Q son las dos ecuaciones disponibles para reconstruir los datos perdidos. Si fallan exactamente dos discos, el sistema tiene dos incógnitas y dos ecuaciones: tiene solución única. Si falla un tercer disco, el sistema pasa a tener tres incógnitas con solo dos ecuaciones: matemáticamente indeterminado, sin solución única posible.
Diagrama de distribución RAID 6 (6 discos, stripe size 64 KB)
Disco 0 Disco 1 Disco 2 Disco 3 Disco 4 Disco 5 +---------+---------+---------+---------+---------+---------+ | D0_A | D1_A | D2_A | D3_A | P_A | Q_A | <-- Fila A +---------+---------+---------+---------+---------+---------+ | D0_B | D1_B | D2_B | Q_B | P_B | D3_B | <-- Fila B (paridad rotada) +---------+---------+---------+---------+---------+---------+ | D0_C | D1_C | Q_C | P_C | D2_C | D3_C | <-- Fila C +---------+---------+---------+---------+---------+---------+ | D0_D | Q_D | P_D | D1_D | D2_D | D3_D | <-- Fila D +---------+---------+---------+---------+---------+---------+ | Q_E | P_E | D0_E | D1_E | D2_E | D3_E | <-- Fila E +---------+---------+---------+---------+---------+---------+ D = Datos P = Paridad XOR (Reed-Solomon orden 1) Q = Paridad Reed-Solomon (GF(2^8), orden superior) La paridad rota en cada fila (Left Symmetric layout)
En la fila A, por ejemplo, si fallan los discos 0 y 1 (D0_A y D1_A), el controlador puede reconstruirlos resolviendo el sistema P_A = D0_A XOR D1_A XOR D2_A XOR D3_A y Q_A = RS(D0_A, D1_A, D2_A, D3_A). Si también falla el disco 2 (D2_A), ahora hay tres incógnitas y el sistema no tiene solución sin información adicional. Los datos de esa fila son irrecuperables matemáticamente.
¿Qué significa "recuperación parcial"?
La clave de la recuperabilidad con triple fallo está en que no todas las filas del array están igualmente afectadas. Dado que la paridad rota en cada fila (layout Left Symmetric o Left Asymmetric), en una fila concreta los bloques P y Q corresponden a discos diferentes que en otra fila. Esto significa que hay filas donde los tres discos fallidos incluyen ambos bloques de paridad (P y Q) más un dato: esas filas son irrecuperables. Pero hay también filas donde los tres discos fallidos son todos de datos, con P y Q supervivientes en otros discos: esas filas son completamente recuperables.
El porcentaje de filas recuperables depende del número de discos del array y de qué discos han fallado. En un array de 8 discos RAID 6 con 3 discos fallidos, estadísticamente entre el 50 y el 70 % de las filas pueden reconstruirse. La recuperación no es del 100 % del volumen, pero puede ser suficiente para rescatar la mayoría de los archivos críticos.
2. RAID 6 vs RAID 5: tolerancia a fallos comparada
La diferencia fundamental entre RAID 5 y RAID 6 no es solo "un disco más de paridad": es la diferencia entre un sistema de una ecuación y un sistema de dos ecuaciones para reconstruir datos. Esto tiene consecuencias profundas en la recuperabilidad ante fallos múltiples.
| Característica | RAID 5 | RAID 6 |
|---|---|---|
| Discos mínimos | 3 | 4 |
| Bloques de paridad por fila | 1 (P, XOR simple) | 2 (P = XOR, Q = Reed-Solomon GF(28)) |
| Fallos simultáneos tolerados | 1 | 2 |
| Con 2 fallos simultáneos | Datos inaccesibles — requiere laboratorio | Recuperación automática por el controlador |
| Con 3 fallos simultáneos | Inaccesible (ya lo era con 2) | Datos inaccesibles — requiere laboratorio |
| Penalización en escritura | Moderada (1 cálculo de paridad por fila) | Mayor (2 cálculos de paridad por fila) |
| Eficiencia de almacenamiento | (N-1)/N | (N-2)/N |
| Riesgo de URE en rebuild | Crítico: 1 URE durante rebuild = pérdida total | Tolera 1 URE durante rebuild y sigue operativo |
| Tasa de éxito en laboratorio (doble fallo) | 55–80 % | 65–85 % |
| Tasa de éxito en laboratorio (triple fallo) | N/A (matemáticamente imposible con paridad simple) | 45–75 % (recuperación parcial) |
3. Por qué falla un tercer disco en un RAID 6
Los administradores de sistemas a veces se preguntan cómo es posible que fallen tres discos en un sistema diseñado para tolerar dos. La respuesta está en que los fallos raramente son independientes entre sí: existe una correlación temporal y operacional que convierte el fallo de dos discos en el detonante del tercero.
Fallo simultáneo durante el proceso de rebuild
Es la causa más frecuente de triple fallo en RAID 6 empresarial. El escenario es el siguiente: el primer disco falla normalmente por desgaste. El controlador detecta el fallo, marca el array como degradado y, si hay hot spare disponible, inicia automáticamente el rebuild. Durante el rebuild, el sistema lee el 100 % de los datos de todos los discos supervivientes. Este estrés de lectura intensiva puede desencadenar el fallo de un segundo disco que tenía sectores defectuosos latentes o una tasa de URE elevada.
RAID 6 tolera este segundo fallo durante el rebuild y lo completa utilizando la paridad Q. Sin embargo, si durante esa reconstrucción —ahora con solo la paridad Q disponible— falla un tercer disco, el sistema queda sin recursos matemáticos para continuar. El rebuild se interrumpe y el array pasa a estado "Failed" con tres discos fuera del volumen.
Ransomware que cifra el array completo
Los ataques de ransomware corporativo (LockBit, BlackCat/ALPHV, Akira, RansomHub) no destruyen discos físicamente, pero sí cifran los datos que el sistema operativo puede ver: el volumen lógico del array completo. Desde la perspectiva del controlador RAID, todos los discos están operativos y el array está en estado normal. Desde la perspectiva de los datos, el contenido del volumen está completamente cifrado.
En estos casos, el "fallo" no es de discos individuales sino del volumen lógico. La paridad P y Q del RAID 6 sigue siendo consistente con los datos cifrados: el controlador reconstruiría correctamente los datos cifrados si fallara un disco. La recuperación depende exclusivamente de si existe un snapshot anterior al cifrado, una copia fuera del alcance del ransomware, o si el cifrado del grupo de amenaza utilizado tiene alguna vulnerabilidad conocida.
Corrupción de firmware o de metadatos del controlador
Las controladoras RAID hardware (Dell PERC H730/H740, HP Smart Array P408i, Broadcom/LSI MegaRAID 9460, Adaptec SmartRAID 3200) almacenan los metadatos del array —stripe size, orden de discos, tipo de paridad, número de serie de los miembros— en su NVRAM interna y en los primeros sectores de cada disco miembro. Una actualización de firmware fallida, un corte de corriente durante la escritura de metadatos, o un bug en el firmware del controlador pueden corromper estos metadatos.
Cuando los metadatos se corrompen, el controlador puede presentar algunos o todos los discos como "Foreign" o "Not a Member", siendo incapaz de ensamblar el array. Los datos en los discos están intactos, pero sin los parámetros de configuración el sistema no puede reconstruir el volumen. Este escenario se trata como un "fallo lógico múltiple" y tiene mejor pronóstico que el fallo físico de discos.
Fallos de discos de la misma remesa o lote de fabricación
Es un fenómeno documentado y estudiado por fabricantes como Backblaze en sus informes anuales de fiabilidad: los discos del mismo lote de fabricación, del mismo modelo y adquiridos al mismo tiempo tienen una probabilidad significativamente mayor de fallar en un intervalo temporal cercano. Esto se debe a que comparten el mismo desgaste acumulado y los mismos defectos de fabricación de la tirada. En un RAID 6 compuesto por seis discos WD Gold de 8 TB del mismo pedido instalados el mismo día, el fallo del primero a los 4 años es un indicador estadístico del estado de los demás. Sin monitorización S.M.A.R.T. proactiva, los fallos sucesivos pueden acumularse antes de que el administrador tome medidas.
4. Proceso de recuperación en laboratorio con PC-3000 RAID
La recuperación forense de un RAID 6 con triple fallo es el caso más complejo de la recuperación RAID. El proceso en nuestro laboratorio sigue un protocolo de siete fases diseñado para maximizar la recuperación sin modificar nunca los discos originales:
Fase 1 — Diagnóstico individual y clasificación del tipo de fallo
Cada disco del array se evalúa de forma independiente con PC-3000 UDMA: lectura de registros S.M.A.R.T. extendidos (no solo los estándar), mapa de sectores defectuosos, estado de la zona de traducción de G-List, temperatura operativa histórica y estado de la PCB. Esta fase determina qué discos requieren intervención física antes de poder clonarse y cuáles pueden clonarse directamente. El diagnóstico es gratuito e incluye un informe técnico detallado por disco.
Fase 2 — Intervención física en sala limpia ISO 5 (si procede)
Si alguno de los discos fallidos presenta daño mecánico (cabezales dañados, motor gripado, platos rayados, PCB quemada), el técnico de sala limpia realiza la intervención necesaria: cambio de cabezales desde un disco donor de la misma revisión de firmware, limpieza de platos con IPA anidrous, o sustitución de PCB con transferencia de ROM. Esta fase puede añadir 3–7 días laborables al proceso pero es imprescindible para obtener una imagen legible de los discos afectados.
Fase 3 — Imagen forense de cada disco
Se crea una imagen bit a bit de cada disco mediante PC-3000 Portable o DeepSpar Disk Imager. Las imágenes se almacenan en medios propios del laboratorio; los discos originales quedan en custodia y no se vuelven a conectar. Los sectores ilegibles se mapean con precisión de LBA: esta información es crítica para la fase de reconstrucción, ya que determina exactamente qué filas del array tendrán bloques vacíos.
Fase 4 — Detección de parámetros RAID mediante el módulo PC-3000 RAID
El módulo RAID de PC-3000 analiza las imágenes para determinar automáticamente o por heurística los parámetros del array: stripe size (típicamente 64, 128 o 256 KB en controladoras hardware), orden de los discos en el array, layout de paridad (Left Symmetric, Left Asymmetric, Right Symmetric), algoritmo Q (Reed-Solomon estándar, EVENODD, RDP), y offset de inicio de datos. En controladoras que escriben metadatos en los discos (Dell PERC, HP Smart Array, Broadcom MegaRAID), estos parámetros pueden leerse directamente. En otros casos se detectan por análisis estadístico de patrones de datos.
Fase 5 — Reconstrucción virtual del array con bloques vacíos
Con los parámetros correctos y las imágenes disponibles, el software de reconstrucción RAID ensambla un array virtual que incluye los bloques leídos correctamente y marca como "no disponible" los bloques correspondientes a los tres discos fallidos (o a los sectores defectuosos de discos parcialmente legibles). Para cada fila del array, el motor de recuperación evalúa cuántos de los tres bloques fallidos son de datos y cuántos son de paridad P y/o Q:
- 0 bloques fallidos en la fila: Datos completamente accesibles sin reconstrucción.
- 1 bloque fallido (dato o paridad): Reconstrucción posible usando P o Q.
- 2 bloques fallidos (dato + dato, o dato + paridad): Reconstrucción posible usando P+Q (capacidad nominal de RAID 6).
- 3 bloques fallidos: Sistema indeterminado — bloque irrecuperable. Se marca como vacío en el volumen virtual.
Fase 6 — Análisis del sistema de archivos y extracción selectiva
El volumen virtual se analiza con herramientas de recuperación de sistemas de archivos (NTFS, ext4, XFS, vmfs, ZFS). En volúmenes NTFS el análisis de la MFT (Master File Table) y su mirror permite identificar qué archivos tienen sus bloques completamente disponibles, cuáles tienen bloques parcialmente perdidos, y cuáles son completamente irrecuperables. Los archivos con todos sus bloques disponibles se extraen con integridad completa verificada por hash. Los archivos con bloques parcialmente perdidos se extraen con los bloques disponibles, lo que puede producir archivos válidos si los bloques perdidos corresponden a segmentos no críticos del archivo.
Fase 7 — Verificación, listado y entrega
El cliente recibe un listado completo de los archivos recuperados con indicación del porcentaje de integridad de cada uno, antes de que se emita ninguna factura. Los datos se entregan en un soporte de almacenamiento nuevo (disco duro externo o transferencia segura cifrada). Solo se cobra si el cliente aprueba el resultado. Si no hay recuperación útil, no hay coste.
5. Precios, plazos y casos de empresa reales
Estructura de precios para RAID 6 con triple fallo o más
| Configuración | Tipo de daño | Precio estimado (+ IVA) | Plazo habitual |
|---|---|---|---|
| RAID 6 / 4-6 discos, 3 fallidos (fallo lógico) | Metadatos corruptos, controladora fallida | 2.000–3.500 € | 10–15 días laborables |
| RAID 6 / 4-6 discos, 3 fallidos (1 con daño físico) | Sala limpia en 1 disco + lógico en 2 | 2.800–4.500 € | 12–18 días laborables |
| RAID 6 / 6-8 discos, 3 fallidos (2 con daño físico) | Sala limpia en 2 discos | 3.500–5.500 € | 15–22 días laborables |
| RAID 6 / 8+ discos, 3+ fallidos (daño físico múltiple) | Sala limpia en 2+ discos, array grande | 4.500–6.000 € | 18–25 días laborables |
Los precios son orientativos. El diagnóstico es gratuito y el presupuesto definitivo se facilita antes de iniciar cualquier trabajo. Sin resultados = sin coste. Disponemos de servicio urgente (24–48 h de diagnóstico) para empresas con necesidades críticas; consulta disponibilidad al solicitar el presupuesto.
Ejemplo 1 — Empresa logística (Zaragoza, RAID 6 de 6 discos SAS, 24 TB)
Servidor HP ProLiant DL380 Gen10 con controladora HP Smart Array P408i-p y 6 discos SAS de 4 TB en RAID 6. Un primer disco falló y fue reemplazado con hot spare. Durante el rebuild, un segundo disco desarrolló un error S.M.A.R.T. crítico (C5 = 1.240) y fue marcado como fallido por la controladora. Antes de que el administrador pudiera intervenir, un tercer disco —del mismo lote de fabricación de 4 años antes— también falló. El array quedó en estado "Failed". Diagnóstico: tres discos con fallo lógico-electrónico, sin daño físico en platos. Recuperación: imagen completa de los 6 discos, detección automática de parámetros (stripe 256 KB, Left Asymmetric, orden 0-1-2-3-4-5 confirmado por metadatos HP), reconstrucción virtual, 91 % de los datos recuperados (94 % en NTFS, 78 % en la zona de logs de base de datos). Plazo: 11 días. Coste: 3.200 € + IVA.
Ejemplo 2 — Clínica dental (Valencia, NAS Synology con SHR-2 / RAID 6, 8 discos)
NAS Synology RS3621RPxs con 8 discos WD Red Pro de 6 TB configurados en SHR-2 (equivalente a RAID 6 con discos de igual tamaño). El NAS sufrió un corte de corriente sin SAI durante una tormenta. Al restaurar la alimentación, el sistema informó de tres discos "degradados" y el volumen no pudo montarse. El administrador intentó ejecutar fsck desde la interfaz de Synology, lo que generó escrituras en los discos antes de que llegaran a nuestro laboratorio. Diagnóstico: dos discos con sectores defectuosos extensos, uno con cabezal dañado (sala limpia). Recuperación: tras sala limpia en el disco 3, imagen de los 8 discos, reconstrucción ext4 con mdadm virtual, 83 % de los archivos recuperados. Los archivos irrecuperables eran principalmente archivos de base de datos de radiografías con bloques que coincidían en los tres discos más afectados. Plazo: 17 días. Coste: 4.800 € + IVA.
6. Escenarios empresariales: VMware datastore y NAS con RAID 6
VMware datastore sobre RAID 6
Es uno de los escenarios más complejos que atendemos. Un datastore VMFS sobre un RAID 6 que sufre triple fallo presenta dos niveles de recuperación: primero hay que reconstruir el array RAID y obtener el volumen VMFS; luego hay que analizar el sistema de archivos VMFS (versión 5 o 6) para localizar y extraer los archivos VMDK de las máquinas virtuales; finalmente hay que tratar cada VMDK como un disco virtual y recuperar el sistema de archivos dentro de él (NTFS para Windows guests, ext4/XFS para Linux guests).
El factor crítico en un datastore es que los VMDK pueden estar distribuidos en thin provisioning: los bloques de un disco virtual de 500 GB pueden estar dispersos por todo el espacio del datastore, dependiendo de cuándo se escribieron. Si los bloques irrecuperables del RAID 6 corresponden a LBAs que el datastore asignó a un VMDK concreto, ese disco virtual tendrá corrupción interna y la VM puede no arrancar aunque el sistema de archivos VMFS sea accesible. Nuestra metodología incluye análisis granular de la tabla de asignación del datastore para identificar qué VMs están completamente recuperables antes de extraerlas.
NAS empresarial con RAID 6: Synology, QNAP y sistemas mdadm
Los NAS empresariales que ejecutan RAID 6 (Synology SHR-2, QNAP RAID 6, NAS con mdadm) utilizan el stack mdadm de Linux con un superbloque en los primeros bloques de cada disco. Este superbloque contiene los parámetros del array: UUID del conjunto, número de discos, stripe size, nivel de RAID y número de serie de cada miembro.
Cuando tres discos fallan, el superbloque de los discos supervivientes sigue conteniendo la información completa de configuración del array. Esto es una ventaja significativa respecto a controladoras hardware propietarias: los parámetros RAID están disponibles sin necesidad de análisis heurístico. El proceso de recuperación puede comenzar directamente con la reconstrucción virtual del mdadm, reduciendo el tiempo y el coste del diagnóstico.
Si tu NAS muestra tres o más discos como "crashed" o el volumen aparece como "degraded" con múltiples fallos, no inicialices ningún disco, no ejecutes "Repair" desde la interfaz del NAS y no reinstales el sistema operativo del NAS. Estas acciones sobrescriben los superbloques mdadm y destruyen los metadatos de configuración del array, convirtiendo un escenario recuperable en uno irrecuperable. Apaga el NAS y contacta con un laboratorio especializado antes de tomar cualquier acción.
El sistema de archivos típico en NAS RAID 6 de Synology y QNAP es Btrfs (en versiones recientes) o ext4. Btrfs tiene la ventaja de incluir checksums por bloque y Copy-on-Write, lo que permite a nuestro laboratorio identificar con precisión qué bloques están dañados (checksum fallido) frente a los que están íntegros, independientemente de la posición en el RAID. En arrays con Btrfs, la tasa de recuperación de archivos íntegros suele ser mayor que en ext4 porque el sistema de archivos mismo tiene información sobre la integridad de cada bloque.
¿Tu empresa tiene un RAID 6 con tres o más discos fallidos?
Cada hora que pasa aumenta el riesgo de daño adicional en los discos supervivientes. Nuestro equipo especializado en recuperación RAID atiende empresas de toda España con servicio urgente: recogida en 24 horas, diagnóstico gratuito y presupuesto cerrado sin coste si no hay resultado.
Servicio disponible en toda España. Diagnóstico gratuito. Sin resultados = sin coste. NDA disponible.
7. Preguntas frecuentes
¿Tu empresa necesita recuperar un RAID 6 con múltiples fallos?
Especialistas en recuperación RAID empresarial: PC-3000, sala limpia propia ISO 5, experiencia con Dell PERC, HP Smart Array, Broadcom/LSI, Synology y QNAP. Diagnóstico gratuito en 24 horas.
Recogida gratuita de discos en toda España. NDA disponible. Sin resultados = sin coste.
Solicitar presupuesto para empresaO llámanos: 900 899 002