Recuperar Datos de Máquinas Virtuales VMware, Hyper-V y VirtualBox
Las máquinas virtuales almacenan sistemas operativos y datos completos dentro de archivos en el servidor físico host. Cuando una VM se corrompe, se borra accidentalmente o el host falla, la recuperación requiere un enfoque especializado que combina conocimientos de virtualización con técnicas de recuperación de datos. La buena noticia: en la mayoría de casos, los datos son recuperables.
Formatos de disco virtual: VMDK, VHD/VHDX y VDI
Cada plataforma de virtualización usa su propio formato de disco virtual:
- VMDK (VMware Virtual Machine Disk): Usado por VMware Workstation, VMware Player y VMware vSphere/ESXi. Puede dividirse en múltiples archivos de 2 GB o estar en un único archivo. Un VMDK incluye un archivo descriptor (.vmdk pequeño) y uno o más archivos de datos (-flat.vmdk).
- VHD/VHDX (Virtual Hard Disk): Formato de Microsoft para Hyper-V y Azure. VHD es el formato legado (máximo 2 TB); VHDX es el moderno (hasta 64 TB, más resiliente ante fallos de alimentación). VHDX incluye journaling interno que mejora la recuperación.
- VDI (VirtualBox Disk Image): Formato nativo de Oracle VirtualBox. Menos común en entornos empresariales pero muy usado en desarrollo y pruebas.
Corrupción de cadenas de snapshots
Los snapshots (instantáneas) son una función muy útil pero también la principal causa de corrupción en VMs. Cuando creas un snapshot, el disco base queda congelado y todos los cambios se escriben en un archivo delta (en VMware, archivos -delta.vmdk; en Hyper-V, archivos .avhd o .avhdx). Si el servidor se apaga abruptamente mientras se consolida un snapshot, la cadena queda inconsistente. Para recuperar en este escenario, el laboratorio reconstruye manualmente la cadena analizando los metadatos de cada archivo delta.
Escenarios de fallo: host vs. guest
Existen dos tipos de fallo con implicaciones muy distintas:
- Fallo del host (el servidor físico falla): El archivo VMDK/VHD puede estar íntegro en el disco, pero el disco del servidor tiene sectores defectuosos, fallo electrónico o fallo mecánico. El proceso: recuperar primero el disco físico del servidor, extraer los archivos de disco virtual, luego recuperar los datos de dentro de la VM.
- Fallo del guest (el sistema operativo dentro de la VM se corrompe): El archivo VMDK está bien en el host, pero el sistema de archivos interno (NTFS, ext4, etc.) está corrompido. Se puede montar el VMDK directamente en el host o en otra máquina y recuperar los datos sin arrancar la VM.
Thin provisioning y sus implicaciones en la recuperación
En VMware vSphere y Hyper-V, los discos virtuales thin provisioned solo ocupan el espacio realmente usado. Cuando la VM escribe datos y luego los borra, esos sectores en el disco virtual quedan marcados como libres pero en el disco físico del host siguen ocupados. Esto significa que la recuperación de archivos borrados dentro de la VM es posible si no se han sobreescrito; al clonar el disco virtual para recuperación, hay que tratar con cuidado el mapeo entre espacio lógico del guest y espacio físico del host.
Recuperación de VM eliminada y VMDK corrupto
Cuando se borra una VM completa del datastore de ESXi o Hyper-V, los archivos VMDK/VHD suelen seguir en el disco del servidor hasta que se sobreescriben. Con acceso al datastore (vía SSH en ESXi o directamente en el volumen NTFS del Hyper-V host), es posible recuperar los archivos eliminados. Si el VMDK está corrupto (cabecera dañada, descriptores incorrectos), se puede reconstruir manualmente la cabecera a partir del análisis hex del archivo de datos.
Checkpoints de Hyper-V y recuperación de vSphere/ESXi
Los checkpoints de Hyper-V (equivalente a los snapshots de VMware) crean archivos AVHDX en una cadena. Microsoft recomienda un máximo de 50 checkpoints, pero en la práctica las cadenas largas aumentan el riesgo de corrupción. Para VMware vSphere/ESXi, el datastore VMFS tiene su propio sistema de archivos optimizado para VMs; si el datastore se corrompe, herramientas como VMware Data Recovery, Veeam o el acceso directo vía SSH al servidor ESXi permiten extraer los archivos de disco virtual.
VirtualBox encryption y consideraciones especiales
VirtualBox permite cifrar los discos VDI con AES-128 o AES-256. Si el disco está cifrado y se pierde la contraseña, la recuperación de datos es matemáticamente imposible. Si el disco no está cifrado pero el archivo VDI se corrompe, las mismas técnicas de recuperación de sistemas de archivos internos (NTFS, ext4) aplican una vez montado el VDI en modo raw.
Precios orientativos de recuperación de máquinas virtuales
| Escenario | Complejidad | Precio estimado |
|---|---|---|
| VM eliminada accidentalmente (archivos recuperables) | Baja | €200 – €350 |
| Snapshot corrupto, cadena simple | Media | €300 – €500 |
| Fallo del host con VMDK intacto (recuperación lógica) | Media | €350 – €550 |
| VMDK/VHD corrupto (reconstrucción de cabecera) | Alta | €500 – €750 |
| Fallo físico del host + cadena de snapshots larga | Muy alta | €700 – €1.000 |