Los SSD fallan sin avisar: cómo detectarlo antes y prevenir la pérdida de datos
A diferencia de un disco duro mecánico, un SSD no hace ruidos antes de morir. No hay clic-clic, no hay lentitud gradual que avise con semanas de antelación. Puede funcionar perfectamente esta mañana y dejar de existir esta tarde. Conocer los modos de fallo específicos de los SSD, los atributos SMART que debes vigilar y las herramientas gratuitas disponibles puede marcar la diferencia entre un susto y una pérdida de datos irreversible.
Datos clave — Fallos de SSD y prevención
Ninguna en ~30% de casos
Sí (con matices importantes)
CrystalDiskInfo
250€–1.500€ + IVA
Por qué los SSD fallan de repente (y los HDD no)
Un disco duro mecánico (HDD) tiene piezas en movimiento: platos magnéticos, cabezales de lectura y un motor que hace girar el conjunto a miles de revoluciones por minuto. Cuando un HDD empieza a fallar, el deterioro es generalmente gradual y ruidoso: los cabezales comienzan a fallar en sectores concretos, el motor spindle desarrolla vibraciones detectables, el número de sectores reasignados crece semana a semana. SMART registra todo eso. Tienes semanas, a veces meses, para actuar.
Un SSD no tiene partes móviles. Almacena los datos en celdas de memoria NAND Flash organizadas en páginas y bloques. El fallo de una celda individual no produce ningún sonido, ninguna vibración, ningún calor perceptible. El controlador del SSD aplica corrección de errores (ECC) para compensar celdas defectuosas, pero cuando el número de celdas en mal estado supera la capacidad de corrección, el fallo puede ser instantáneo y total.
Además, la naturaleza del fallo cambia radicalmente según el componente afectado. Si falla el controlador (el "cerebro" del SSD), el dispositivo puede desaparecer del sistema sin previo aviso en cuestión de milisegundos, aunque todos los chips NAND estén perfectamente intactos. Esto hace que el SSD sea estadísticamente más impredecible que el HDD en cuanto a cuándo exactamente falla, aunque la degradación subyacente siga siendo rastreable con las herramientas adecuadas.
Tipos de fallo en SSD: de dónde vienen los problemas
Entender los modos de fallo posibles es el primer paso para reconocer cuál puede estar afectando a tu unidad. Los SSDs pueden fallar por razones muy distintas, con consecuencias y probabilidades de recuperación diferentes en cada caso.
1. Desgaste de celdas NAND (agotamiento del TBW)
Cada celda NAND puede escribirse y borrarse un número limitado de veces antes de degradarse. Los SSDs de consumo modernos usan principalmente NAND TLC (Triple-Level Cell) con una resistencia de entre 1.000 y 3.000 ciclos de escritura por celda, y en menor medida QLC (Quad-Level Cell) con apenas 500-1.000 ciclos. Cuando las celdas se agotan, el controlador no puede corregir los errores mediante ECC y el SSD puede volverse inaccesible. Este modo de fallo es el más predecible: el SMART recoge los datos de desgaste con bastante fidelidad.
2. Fallo del controlador
El controlador es el chip que gestiona todas las operaciones del SSD: traduce las direcciones lógicas del sistema operativo en direcciones físicas de las celdas NAND (FTL, Flash Translation Layer), aplica el wear leveling para distribuir las escrituras uniformemente, ejecuta la corrección de errores ECC y gestiona el garbage collection. Un fallo del controlador puede ocurrir por defectos de fabricación, sobrecalentamiento sostenido, sobretensión eléctrica o simplemente desgaste. Es el modo de fallo más común en SSDs modernos y, paradójicamente, uno de los más favorables para la recuperación de datos, porque los chips NAND suelen quedar intactos.
3. Corrupción del firmware (bug en la Service Area)
El firmware del SSD se almacena en una zona reservada de los propios chips NAND llamada Service Area. Si esta zona se corrompe —por un corte de energía durante una actualización de firmware, por un bug del propio firmware o por desgaste en las celdas que la contienen— el SSD puede quedar completamente inaccesible, apareciendo con 0 bytes o en modo BSY (busy). Marcas como Samsung, SanDisk y Crucial han publicado a lo largo de los años actualizaciones críticas de firmware para corregir bugs que en algunos casos podían hacer inaccesibles los datos.
4. Fallo de condensadores por pérdida de energía durante escritura
Los SSDs de calidad empresarial incorporan condensadores de protección que, ante un corte de energía, almacenan suficiente carga para completar las escrituras en curso y proteger la FTL. Los SSDs de consumo no suelen tener estos condensadores. Un corte de energía mientras el SSD está escribiendo datos puede corromper la FTL (la tabla de traducción de direcciones), lo que hace que el SSD sea incapaz de encontrar sus propios datos. El dispositivo puede aparecer como accesible pero con el sistema de ficheros completamente corrompido, o directamente como no reconocido.
5. Read disturb (perturbación de lectura)
Este es un modo de fallo menos conocido pero relevante en SSDs con muchos años de uso en modo solo lectura (archivos de archivo, copias de seguridad offline). Cada operación de lectura de una celda NAND genera un leve campo eléctrico que puede alterar el estado de las celdas adyacentes. En condiciones normales, las escrituras periódicas refresc an los datos afectados. Pero si un SSD lleva años sin escribirse, el acúmulo de lecturas puede causar errores de bit en zonas concretas. Los SSDs modernos tienen mecanismos para mitigarlo (read disturb management), pero en unidades antiguas o de baja calidad puede aparecer.
6. Fallo eléctrico de la PCB (placa de circuito impreso)
Un pico de tensión, un rayo, un cargador defectuoso o simplemente el envejecimiento de los componentes electrónicos puede dañar la PCB del SSD sin afectar a los chips NAND. En estos casos, el SSD no aparece en el sistema pero los datos siguen físicamente intactos en los chips de memoria. La reparación de la PCB o, en el peor caso, la técnica chip-off permiten acceder a los datos.
Cómo monitorizar la salud con SMART: atributos específicos para SSD
SMART (Self-Monitoring, Analysis and Reporting Technology) existe desde los años 90 y fue diseñado originalmente para discos duros mecánicos. La mayoría de sus atributos clásicos (Seek Error Rate, Spin-Up Time, Reallocated Sector Count) son directamente aplicables a HDD pero no a SSD. Sin embargo, los fabricantes de SSDs han añadido atributos específicos para el estado de la NAND Flash que son muy útiles si sabes interpretarlos correctamente.
El problema es que no existe un estándar unificado: cada fabricante usa sus propios ID hexadecimales y nombres para los mismos conceptos. Samsung usa el atributo BB (hex) para el Media Wearout Indicator; Intel usa el atributo E2 (hex) para el mismo concepto pero lo llama de forma diferente. A continuación encontrarás los atributos más importantes con sus IDs hexadecimales más habituales:
| ID (hex) | Nombre habitual | Qué mide | Umbral de alerta | Fabricantes principales |
|---|---|---|---|---|
| B1 / BB | Media Wearout Indicator / Wear Leveling Count | Porcentaje de vida útil de las celdas NAND restante. Valor normalizado empieza en 100 y decrece hacia 0 | Por debajo de 10 = final de vida inminente. Por debajo de 20 = actúa ahora | Samsung, Intel, Micron, Crucial |
| 09 | Power-On Hours | Horas totales de encendido acumuladas desde fabricación | >40.000h en SSD de consumo merece revisión del resto de atributos | Todos |
| 05 | Reallocated Sector Count / Retired Block Count | Número de bloques NAND defectuosos reasignados a la zona de reserva (spare blocks). En SSD, los "sectores" son bloques flash. | Cualquier valor >0 merece atención. Crecimiento rápido = alerta | Todos (con distintos valores raw) |
| E8 / E1 | Available Reserved Space / Spare Block Count Remaining | Porcentaje de bloques de reserva todavía disponibles para sustituir bloques defectuosos | Por debajo de 10% = sin margen de seguridad | Intel, Crucial, WD, SanDisk |
| AE / C3 | Unexpected Power Loss Count | Número de veces que el SSD sufrió un corte de energía inesperado durante escrituras activas | Valores altos (>100) en SSD sin condensadores de protección = riesgo de corrupción FTL | Samsung, WD, SanDisk |
| AB | Program Fail Count | Número de operaciones de escritura (program) que han fallado y no han podido completarse en ningún bloque alternativo | Cualquier valor >0 es una señal de alerta seria | Samsung, Crucial, Micron |
| AC | Erase Fail Count | Número de operaciones de borrado de bloque que han fallado. Indica celdas NAND que ya no pueden borrarse correctamente | Cualquier valor >0 es una señal de alerta seria | Samsung, Crucial, Micron |
| C2 | Temperature | Temperatura actual del SSD en grados Celsius | >70°C sostenido = degradación acelerada. Rango óptimo: 0-60°C | Todos |
| F1 | Total LBAs Written (Host Writes) | Total de datos escritos por el host en GB/TB desde fabricación. Permite calcular el TBW consumido vs. el TBW garantizado | Cuando el valor escrito supera el TBW del fabricante = garantía vencida, mayor riesgo | Todos (en GiB o LBAs) |
| E7 | SSD Life Left / Percent Lifetime Remaining | Porcentaje de vida estimada restante según el fabricante. Es el indicador más directo y sencillo de interpretar | Por debajo de 10% = planifica sustitución inmediata | WD, SanDisk, Kingston |
Herramientas gratuitas para monitorizar tu SSD
Existen varias herramientas de calidad que permiten leer los atributos SMART de tu SSD de forma sencilla. La elección depende de tu sistema operativo y del fabricante de tu unidad.
CrystalDiskInfo (Windows, gratuita)
Es la herramienta de referencia para Windows. Lee todos los atributos SMART de SSDs SATA y NVMe, muestra un indicador general de salud (Good / Caution / Bad), la temperatura actual en tiempo real y el historial de valores. Puede configurarse para ejecutarse al inicio del sistema y enviar alertas cuando un atributo cambia de estado. Es el punto de partida que recomendamos a cualquier usuario.
Samsung Magician (Windows/macOS, gratuita, solo Samsung)
La herramienta oficial de Samsung para sus SSDs 860/870 EVO/PRO, 980/990 PRO y serie 870 QVO. Muestra el porcentaje de vida restante con mayor precisión que CrystalDiskInfo (que a veces no interpreta correctamente los atributos propietarios de Samsung), permite actualizar el firmware, ejecuta diagnósticos avanzados y gestiona el modo de Over Provisioning. Si tienes un SSD Samsung, esta herramienta es imprescindible.
WD Dashboard y SanDisk Dashboard (Windows, gratuitas)
Las herramientas oficiales de Western Digital y SanDisk (ambas marcas pertenecen al mismo grupo). Equivalentes a Samsung Magician pero para sus respectivas unidades: WD Blue/Black/Red SSD, SanDisk Ultra, WD_BLACK SN770/SN850. Incluyen diagnóstico SMART avanzado, actualización de firmware y estadísticas de uso.
SSD Life (Windows, freemium)
Especializada en proyectar la vida útil restante del SSD basándose en los datos SMART históricos. Muestra una estimación de cuándo fallará la unidad con el ritmo de uso actual. Es útil como complemento a CrystalDiskInfo para tener una referencia temporal, aunque las estimaciones deben tomarse como indicativas.
smartmontools (Linux/macOS/Windows, gratuita, código abierto)
La herramienta de referencia para entornos Linux y macOS. El comando smartctl -a /dev/sda (o smartctl -a /dev/nvme0 para NVMe) muestra todos los atributos SMART en texto plano. En Linux puede configurarse para ejecutar un demonio (smartd) que monitoriza continuamente y envía alertas por email. Es la opción estándar en servidores.
TBW: cuántos años le quedan a tu SSD
El TBW (Terabytes Written) es la cifra que el fabricante garantiza como total de datos que pueden escribirse en el SSD a lo largo de su vida útil. Superado ese umbral, el fabricante no cubre el dispositivo bajo garantía, aunque en la práctica muchos SSDs siguen funcionando bastante tiempo después de superar su TBW nominal.
Para calcular cuántos años le quedan a tu SSD, solo necesitas dos datos:
- El TBW garantizado por el fabricante (aparece en las especificaciones técnicas del modelo)
- El total de datos ya escritos (atributo F1 / Total LBAs Written en CrystalDiskInfo, expresado en GB o TB)
Fórmula: Años restantes = (TBW garantizado − GBs ya escritos) ÷ (escritura media diaria en GB × 365)
Ejemplo práctico: Tienes un Samsung 870 EVO de 500 GB con 300 TBW garantizados. CrystalDiskInfo muestra que llevas escritos 45 TB. Tu uso diario típico es de 15 GB/día (mezcla de trabajo de oficina, algo de edición de fotos y navegación).
- TBW restante: 300 − 45 = 255 TB
- Años estimados: 255.000 GB ÷ (15 GB/día × 365 días) = 46,6 años
Para un usuario doméstico típico, el TBW rara vez es el factor limitante. Los usos que sí pueden agotar el TBW en pocos años son: edición de vídeo profesional con escrituras de 100+ GB/día, servidores de bases de datos con escrituras intensivas, máquinas virtuales con alto I/O de disco, o sistemas de vigilancia con grabación continua.
| Modelo | Capacidad | TBW | Años con 20 GB/día | Años con 100 GB/día |
|---|---|---|---|---|
| Samsung 870 EVO | 500 GB | 300 TBW | 41 años | 8,2 años |
| Samsung 990 PRO | 1 TB | 600 TBW | 82 años | 16,4 años |
| WD Blue SN570 | 1 TB | 600 TBW | 82 años | 16,4 años |
| Crucial MX500 | 500 GB | 180 TBW | 24,7 años | 4,9 años |
| Kingston A2000 | 1 TB | 600 TBW | 82 años | 16,4 años |
| Samsung PM9A3 (empresarial) | 1.92 TB | 3.500 TBW | 479 años | 95,9 años |
Señales de aviso antes del fallo total
Aunque los SSDs pueden fallar sin aviso, en muchos casos sí existen síntomas previos que hay que saber reconocer. A diferencia de los HDDs donde los síntomas son principalmente auditivos, en los SSDs son de comportamiento del sistema:
El SSD entra en modo solo lectura
Algunos SSDs, cuando el controlador detecta que las celdas NAND están al límite de su capacidad de escritura, activan automáticamente un modo de protección en el que el disco sigue siendo legible pero rechaza todas las escrituras. El síntoma más claro es que el sistema se congela al intentar guardar archivos, pero los datos existentes siguen accesibles. Este modo de "fail-safe" es una buena noticia: los datos están disponibles para copiarse. No todos los modelos lo implementan.
Lentitud extrema e inusual de repente
Un SSD que de repente va dramáticamente más lento que antes —tardando segundos en operaciones que antes eran instantáneas— puede estar en un estado de degradación avanzada en el que el controlador realiza reintentos masivos de lectura/escritura o ejecuta garbage collection de emergencia. Si un equipo que antes era ágil empieza a comportarse como si tuviera un HDD lento de hace diez años, el SSD debe ser la primera sospecha.
Archivos que aparecen corrompidos o vacíos
Los bloques defectuosos que el controlador no puede reparar mediante ECC producen errores de lectura silenciosos: el archivo parece guardarse correctamente, pero al abrirlo aparece corrupto, truncado o directamente vacío. Si esto ocurre con varios archivos distintos en un período corto de tiempo, hay celdas NAND fallando activamente y el SSD está en proceso de fallo progresivo.
El SSD desaparece y reaparece del sistema de forma intermitente
Si el SSD se desconecta y reconecta sin motivo aparente (el sistema de ficheros reaparece en el explorador de archivos, el Administrador de Dispositivos muestra alertas), puede indicar un problema en el controlador, en la conexión SATA/NVMe o en la alimentación. En SSDs NVMe M.2, un slot mal insertado o con suciedad puede causar este síntoma, pero también puede ser un precursor de fallo real del controlador.
Errores de escritura registrados en el sistema
En Windows, el Visor de Eventos (Event Viewer) registra errores del subsistema de disco en la categoría "Disk". Busca los Event ID 7, 11 y 15 asociados al disco en cuestión. En Linux, dmesg | grep -i error mostrará mensajes como EXT4-fs error o I/O error, dev sda. Estos errores indican que el sistema operativo está recibiendo confirmaciones de fallo directamente del SSD, no solo suposiciones del software.
Pérdida de datos tras corte de energía
Si tras un corte de luz o un reinicio forzado el sistema informa de errores del sistema de ficheros o faltan archivos recientes, el SSD puede haber sufrido corrupción de la FTL. No necesariamente indica que el SSD esté al final de su vida, pero sí que el próximo corte de energía puede ser fatal para los datos.
Buenas prácticas para prolongar la vida del SSD
Usa un SAI (UPS) para los equipos más críticos
Un SAI (Sistema de Alimentación Ininterrumpida) es la medida más eficaz contra la corrupción de datos por corte de energía. Los SSDs de consumo no tienen condensadores de protección internos, por lo que un corte de luz durante una escritura puede corromper la FTL de forma permanente. Para un ordenador de trabajo con datos importantes, un SAI básico de 600 VA (cuesta entre 60 y 120€) puede ser la diferencia entre un susto y una pérdida catastrófica.
Nunca llenes el SSD por encima del 90% de capacidad
El controlador del SSD necesita bloques libres para hacer wear leveling eficientemente y para mantener el espacio de over-provisioning (bloques de reserva no visibles para el usuario). Cuando el SSD supera el 90% de ocupación, el controlador queda sin bloques de trabajo y el rendimiento puede caer hasta un 50% en escrituras sostenidas. Además, el desgaste se concentra en un menor número de bloques disponibles. Como norma general, mantén un 10-20% de espacio libre en tu SSD principal.
Verifica que TRIM está activo
TRIM es una función del sistema operativo que informa al SSD de qué bloques contienen datos obsoletos para que puedan liberarse de forma proactiva. Sin TRIM activo, el controlador tiene que leer el bloque completo, mover los datos válidos a otro bloque, borrar el original y luego escribir los nuevos datos —una operación llamada Write Amplification que multiplica el desgaste y reduce la velocidad. En Windows, fsutil behavior query DisableDeleteNotify en cmd devuelve 0 si TRIM está activo (el estado correcto). En Linux moderno con sistemas de ficheros ext4 o btrfs, TRIM suele estar habilitado automáticamente.
Apagados correctos: nunca fuerces el corte de energía
Cada vez que mantienes pulsado el botón de encendido para forzar el apagado, o cada vez que se va la luz mientras el PC está en uso, el SSD recibe un Unexpected Power Loss que queda registrado en el atributo SMART correspondiente. En SSDs sin condensadores de protección, esto es un evento de riesgo. Usa siempre el apagado del sistema operativo. Si el equipo se congela y no hay otra opción, hazlo de inmediato en lugar de dejarlo intentar operar en ese estado.
Controla la temperatura
Los SSDs M.2 NVMe en particular pueden alcanzar temperaturas elevadas bajo carga, especialmente en slots de portátil sin disipador térmico. Una temperatura sostenida por encima de 70°C acelera la degradación de las celdas NAND. Si CrystalDiskInfo muestra temperaturas de 75°C o más, añade un disipador térmico M.2 (cuestan entre 5 y 15€) o mejora el flujo de aire del equipo.
Revisa el SMART cada 3-6 meses
La monitorización proactiva es más efectiva que la reactiva. Programa un recordatorio semestral para abrir CrystalDiskInfo y revisar el estado de tus SSDs. Presta especial atención al Wear Leveling Count (debe ser superior a 20), al Program Fail Count y al Erase Fail Count (deben ser 0). Si detectas cualquier valor en amarillo o rojo, haz una copia de seguridad inmediata y valora la sustitución preventiva.
Mantén el firmware actualizado
Los fabricantes publican actualizaciones de firmware que corrigen bugs conocidos, algunos de ellos relacionados con la integridad de datos. Samsung Magician, WD Dashboard y las herramientas equivalentes notifican cuando hay actualizaciones disponibles. Antes de actualizar el firmware, asegúrate de tener una copia de seguridad vigente: aunque las actualizaciones son seguras en condiciones normales, una actualización interrumpida por un corte de luz puede dejar el SSD en un estado no operativo.
Qué hacer si el SSD entra en modo solo lectura
Cuando un SSD activa el modo solo lectura por agotamiento de las celdas NAND, el sistema puede mostrar errores al intentar guardar o crear archivos, o Windows puede reportar que el disco está "protegido contra escritura". El SSD puede seguir siendo perfectamente legible — todos los datos existentes están accesibles.
Pasos a seguir inmediatamente:
- No intentes reparar el SSD ni formatear. Cualquier intento de escritura confirmará que el SSD está en modo protección y puede desestabilizar el estado actual.
- Conecta un disco externo con espacio suficiente y copia todo el contenido del SSD de inmediato. Usa el comando
robocopyen Windows orsyncen Linux para copiar con verificación. - Verifica que la copia es correcta antes de hacer nada más. Abre archivos representativos de las distintas carpetas para confirmar que están intactos.
- Sustituye el SSD. Un SSD en modo solo lectura por agotamiento de NAND no tiene solución; el hardware ha llegado al final de su vida útil.
Cómo los laboratorios recuperan datos de SSD fallidos
Cuando un SSD falla de forma total y ya no hay acceso a los datos, un laboratorio especializado tiene varias técnicas a su disposición según el tipo de fallo. El proceso es muy diferente al de un disco duro mecánico.
Reparación de firmware con PC-3000 SSD
Cuando el firmware del SSD está corrupto (Service Area dañada, módulos de configuración del controlador corruptos), la herramienta profesional PC-3000 SSD de ACE Laboratory permite acceder a la Service Area y reparar o reescribir los módulos dañados. Esta técnica es aplicable a muchos SSDs SATA y algunos NVMe cuando el controlador sigue respondiendo pero el disco aparece con 0 bytes o en modo BSY. Es la primera línea de intervención cuando el fallo parece de firmware.
Chip-off: extracción física de los chips NAND
Cuando el controlador del SSD es completamente irreparable pero los chips NAND están intactos, el laboratorio procede a la extracción física de los chips de memoria mediante una estación de soldadura de aire caliente o infrarrojos. Los chips extraídos se montan en adaptadores y se leen directamente con un lector de NAND profesional (Dataman, Elnec, o equipos propios de los laboratorios).
El desafío del chip-off en SSD es que los datos no están almacenados de forma lineal ni legible directamente: el controlador aplica algoritmos de interleaving (distribuye los datos entre chips para mejorar el rendimiento), scrambling (cifra los datos para mejorar la distribución de ceros y unos) y puede además aplicar cifrado AES-256 por hardware. El laboratorio debe realizar ingeniería inversa del algoritmo específico de la controladora para reordenar y descifrar los datos leídos en bruto.
Monolith extraction: SSDs en un solo chip
Algunos SSDs de formato pequeño (especialmente los usados en ultrabooks, tablets y algunos NVMe propietarios como los de Surface o MacBook Air pre-M1) utilizan un diseño monolítico donde el controlador y los chips NAND están integrados en un único chip o soldados directamente en la placa base. En estos casos, la técnica chip-off estándar no es aplicable directamente. El laboratorio necesita acceder a los pads de prueba del monolito o utilizar técnicas de inspección con microscopio para identificar las líneas de comunicación entre los componentes internos.
Limitación crítica: el cifrado hardware
La mayoría de los SSDs modernos implementan cifrado AES-256 transparente a nivel de hardware en el controlador: todos los datos se cifran automáticamente antes de escribirse en la NAND, incluso si el usuario no ha activado BitLocker ni ningún cifrado de software. La clave de cifrado reside exclusivamente en el controlador. Si el controlador ha fallado de forma irreversible y la clave no puede extraerse, los datos leídos directamente de los chips NAND son ilegibles aunque la integridad física de las celdas sea perfecta. Este es el escenario de recuperación más limitante y la razón por la que algunos casos de chip-off en SSDs modernos no tienen recuperación posible.
En RecuperaTusDatos realizamos el diagnóstico gratuito en 4 horas. Disponemos de PC-3000 SSD, lectores de NAND y experiencia con chip-off en SSDs SATA, NVMe M.2 y formatos propietarios. Política no recovery no fee: si no recuperamos tus datos, no pagas nada. Solicita diagnóstico gratuito o llámanos al 900 899 002.
Preguntas frecuentes
¿Tienes datos críticos en un SSD? Protégelos ahora.
La única protección infalible ante el fallo de un SSD es una copia de seguridad actualizada. Si ya has perdido el acceso a tus datos, nuestro laboratorio realiza diagnóstico gratuito en 4 horas.
Sin recuperación, sin coste. Recogida gratuita en toda España.
Solicitar diagnóstico gratuitoO llámanos: 900 899 002