Recuperación de Datos en Servidores RAID para Empresas: Proceso y Precios
Un servidor RAID empresarial que deja de responder es una emergencia de primer nivel. Tanto si es un Dell PowerEdge, un HP ProLiant o un IBM System X, la pérdida de datos en un servidor de producción puede detener completamente las operaciones. Explicamos los tipos de fallo, el proceso de recuperación en laboratorio y los precios reales según la complejidad del caso.
Escenarios de fallo en servidores RAID empresariales
Cada nivel de RAID tiene una tolerancia al fallo diferente y sus propios escenarios críticos. Estos son los casos más habituales que atendemos:
- RAID 0 (striping sin paridad): Tolera cero fallos. Cualquier disco que falle hace el array ilegible. Frecuente en servidores de edición de vídeo o bases de datos de alta velocidad. La recuperación requiere reconstrucción del striping a partir de los discos supervivientes.
- RAID 1 (espejo): Tolera el fallo de todos los discos menos uno. El escenario crítico es el fallo simultáneo de todos los espejos (en sobreteisiones) o la corrupción del sistema de ficheros que se replica en el espejo en tiempo real.
- RAID 5 (paridad distribuida): Tolera el fallo de 1 disco. El escenario crítico es el fallo de un segundo disco durante la reconstrucción del primero. También el «RAID 5 write hole»: inconsistencias de paridad por corte de luz durante escritura.
- RAID 6 (doble paridad): Tolera el fallo de 2 discos. Los problemas surgen cuando fallan 3 o más discos simultáneamente o cuando la paridad doble está corrompida por errores acumulados.
- RAID 10 (espejo + striping): Tolera el fallo de un disco por grupo espejo. El escenario crítico es el fallo simultáneo de los dos discos del mismo grupo espejo. La recuperación es generalmente más sencilla que en RAID 5/6.
Un aspecto frecuentemente ignorado: el fallo del controlador RAID hardware puede hacer que un array perfectamente intacto sea ilegible si se conectan los discos a un servidor con controladora diferente. La configuración del array está almacenada en la controladora, no en los discos.
Fallo del controlador RAID vs. fallo de los discos
Distinguir entre ambos tipos es crítico para definir el proceso correcto de recuperación:
| Síntoma | Probable causa | Acción correcta |
|---|---|---|
| RAID reportado como degradado en BIOS/POST | Fallo físico de uno o más discos | No forzar reconstrucción; clonar discos antes |
| Array no detectado tras cambiar controladora | Configuración RAID en controladora antigua perdida | Recuperar config de NVRAM o reconstruir virtualmente |
| Array visible pero sistema no arranca | Corrupción del sistema de ficheros o MBR/GPT | Recuperación lógica sobre imagen del array |
| Array reportado como «foreign» | Discos provenientes de controladora diferente | Importar configuración extranjera o reconstrucción manual |
| Ruidos mecánicos en los discos | Fallo físico de cabezales o platos | Apertura en sala limpia; no encender más el servidor |
Proceso de recuperación en laboratorio: paso a paso
Cuando un servidor RAID llega a nuestro laboratorio, el proceso sigue siempre el mismo orden para minimizar el riesgo de pérdida adicional:
- Diagnóstico no destructivo: Análisis S.M.A.R.T. de cada disco, lectura de logs del controlador (si está disponible) y evaluación del daño físico. Sin escritura de ningún tipo en los discos originales.
- Intervención en sala limpia (si es necesaria): Los discos con fallo mecánico se intervienen en sala limpia ISO Clase 5 con piezas donantes del mismo modelo y lote de fabricación.
- Clonado bit a bit de todos los discos: Usando DeepSpar Disk Imager o PC-3000 UDMA, clonamos cada disco a imagen byte a byte incluyendo sectores defectuosos documentados. Los originales no se tocan más.
- Reconstrucción virtual del RAID: Con PC-3000 RAID o ReclaiMe Pro, reconstruimos el array virtualmente. Se identifican el nivel RAID, el tamaño de stripe, el orden de discos y el algoritmo de paridad.
- Recuperación del sistema de ficheros: Sobre el volumen RAID reconstruido, se recupera el sistema de ficheros (NTFS, EXT4, XFS, VMFS) y se extrae el árbol de directorios completo.
- Verificación con el cliente: Antes de la entrega definitiva, el cliente puede verificar los datos mediante acceso remoto seguro o en nuestras instalaciones.
- Entrega y destrucción de copias de trabajo: Entrega en disco externo cifrado o por transferencia segura. Destrucción certificada de las imágenes de trabajo.
Dell PowerEdge, HP ProLiant e IBM: particularidades
Dell PowerEdge con PERC (H700, H710, H730, H740): Las controladoras PERC almacenan la configuración del array en la NVRAM de la tarjeta. Si la tarjeta falla, los discos aparecen como «foreign» en una nueva controladora. Recuperamos la configuración analizando los metadatos que cada disco guarda en su propio sector de configuración.
HP ProLiant con Smart Array (P420, P440, P840): Las controladoras HP Smart Array utilizan el sistema ADG (Advanced Data Guarding), similar a RAID 6 pero con algoritmo propietario. La recuperación requiere conocer las características específicas del algoritmo HP, que difiere del RAID 6 estándar en el cálculo de paridad.
IBM xSeries / System X con ServeRAID: Los servidores IBM usan en muchos modelos hardware Adaptec con firmware personalizado. La compatibilidad con herramientas de recuperación estándar es buena, aunque algunos modelos antiguos requieren adaptadores específicos para la interfaz SAS/SCSI.
El backup en cinta como complemento del RAID
Un RAID protege contra el fallo físico de discos, pero no contra todos los tipos de pérdida de datos. Los RAID no protegen contra:
- Borrado accidental de ficheros o bases de datos (el borrado se replica en tiempo real a todos los discos del espejo)
- Ransomware (el cifrado se propaga inmediatamente a todos los discos del RAID)
- Incendio o inundación del centro de datos
- Robo físico del servidor completo
- Corrupción lógica del sistema de ficheros que se replica en el espejo antes de ser detectada
Las cintas LTO siguen siendo la opción más económica para backups offline de grandes volúmenes en entornos empresariales. El coste por GB es muy inferior al de los discos y, al ser offline, no pueden ser cifradas por ransomware. La regla 3-2-1 —3 copias, 2 soportes distintos, 1 offsite— sigue siendo el estándar recomendado.
Precios orientativos para recuperación de servidores RAID
| Tipo de servidor / RAID | Fallo lógico | Fallo físico | Urgente 24/7 |
|---|---|---|---|
| Servidor RAID 1 (2 discos) | 400–800 € | 700–1.500 € | +50% |
| Servidor RAID 5 (3–5 discos) | 600–1.200 € | 1.000–2.500 € | +50% |
| Servidor RAID 6 (4–8 discos) | 800–1.800 € | 1.500–3.500 € | +50% |
| Servidor RAID 10 (4–8 discos) | 700–1.500 € | 1.200–3.000 € | +50% |
| SAN / RAID 50 / RAID 60 (8+ discos) | 1.500–3.000 € | 2.500–5.000 € | +50% |
Precios sin IVA. Diagnóstico gratuito y sin compromiso. Solo se factura si se recuperan datos. Precio final confirmado tras diagnóstico.
Preguntas frecuentes sobre recuperación de datos en servidores RAID
La reconstrucción somete todos los discos supervivientes a lectura intensiva durante horas. Si alguno tiene sectores defectuosos no detectados puede fallar durante el proceso, convirtiendo un RAID degradado (recuperable) en crashed (mucho más difícil). Si hay cualquier duda sobre el estado de los discos, clona primero y reconstruye después.
Sí. Trabajamos directamente con las imágenes de los discos sin necesidad de la controladora original. Los metadatos de configuración del array que cada disco guarda en su propio sector nos permiten reconstruir virtualmente el RAID incluso sin el hardware original.
El clonado de 6 discos de 2 TB requiere entre 24 y 48 horas (4-8 horas por disco). La reconstrucción virtual y la extracción del sistema de ficheros añaden 8-16 horas más. En servicio estándar el proceso completo tarda 4-12 días laborables. En urgente, clonando en paralelo, entregamos resultados en 48-72 horas.
Muchas pólizas «Todo Riesgo Informático» o «Ciberriesgos» cubren los costes de recuperación de datos. Emitimos un informe técnico detallado con la causa del fallo, el proceso y el coste, que puede presentarse directamente a la aseguradora.
Sí. Recuperamos datastores VMware ESXi (sistema de ficheros VMFS) y volúmenes Hyper-V (VHD/VHDX). El proceso añade capas de complejidad —primero el RAID, después el sistema del hypervisor, después cada VM— pero no impide la recuperación en la gran mayoría de casos.
Sí, para clientes en Barcelona y área metropolitana podemos desplazarnos en 2-4 horas en casos urgentes. Esto permite decidir si la recuperación puede hacerse en el CPD o requiere traslado al laboratorio, minimizando el tiempo de parada.
Depende del estado físico de los discos. Con daño solo lógico o sectores defectuosos limitados, la tasa supera el 95%. Con uno de los discos con daño físico moderado, baja al 80-95%. Con dos discos con daño físico severo, puede bajar al 50-80%. Siempre informamos del porcentaje estimado antes de que el cliente autorice la facturación.
Servidor RAID caído en producción
Diagnóstico gratuito en 2 horas. Desplazamiento urgente en Barcelona. SLA 24/7 para empresas. No cobramos si no recuperamos.
Solicitar presupuesto urgente Llamar ahora: 900 000 000