En Febrero escribí sobre algo que me paso con un nuevo cluster de producción de ESXi con HA. El caso fue que uno de los miembros tuvo problemas en el firmware de la BIOS y la caja blade perdió cierta comunicación con este equipo, lo más afectado fue el acceso a la SAN. Esa parte del problema se solucionó luego que el servidor recibió un update de firmware y encendió sin problemas, pero como se puede leer en la entrada antes mencionada (Unable to contact a primary HA Agent), este problema se resolvió muy fácil (desde mi punto de vista), pero el día de ayer, leyendo el libro de VMware vSphere 4.1 HA and DRS Techincal deepdive, me ha dado cuenta de porque paso y el porqué de la solución.
“The first 5 hosts that join the HA cluster are automatically selected as primary nodes. All other nodes are automatically selected as secondary nodes. When you do a reconfigure for HA, the primary nodes and secondary nodes are selected again. This is virtually random.”
Simple, al deshabilitar HA en el cluster y habilitarlo nuevamente el proceso se inició sin contar que ya no tenía el nodo perdido y así pude agregarlo nuevamente.
Tenía ganas de anotar esto en algún lugar. Vamos a seguir leyendo ¡! Muy interesante este libro!