Improvements to the master startup checks
authorIustin Pop <iustin@google.com>
Thu, 16 Oct 2008 11:36:17 +0000 (11:36 +0000)
committerIustin Pop <iustin@google.com>
Thu, 16 Oct 2008 11:36:17 +0000 (11:36 +0000)
commitd7cdb55d6e470023e082cab452116d67c65b68a7
tree659b01f2c3a62c7a5e76f160ceeda39eab5c2b1f
parent10799c597512abae1aa5a14f2fdbed31078b7962
Improvements to the master startup checks

In order to account for future improvements to master failover, we move
the actual data gathering capabilities from ganeti-masterd into
bootstrap.py, and we leave only the verification into masterd.

The verification procedure is then changed to retry multiple times (up
to one minute) in case most nodes do not respond, and also the algorithm
is changed to require at least half (but not half+1) votes, since our
vote also should count (and we vote for ourselves).

Example for consistent (config-wise) cluster:
  - 5 node cluster, 2 nodes down: still start
  - 4 node cluster, 2 nodes down: retry for one minute, abort

Reviewed-by: ultrotter
daemons/ganeti-masterd
lib/bootstrap.py