Merge branch 'stable-2.9' into stable-2.10
[ganeti-local] / man / gnt-node.rst
1 gnt-node(8) Ganeti | Version @GANETI_VERSION@
2 =============================================
3
4 Name
5 ----
6
7 gnt-node - Node administration
8
9 Synopsis
10 --------
11
12 **gnt-node** {command} [arguments...]
13
14 DESCRIPTION
15 -----------
16
17 The **gnt-node** is used for managing the (physical) nodes in the
18 Ganeti system.
19
20 COMMANDS
21 --------
22
23 ADD
24 ~~~
25
26 | **add** [\--readd] [{-s|\--secondary-ip} *secondary\_ip*]
27 | [{-g|\--node-group} *nodegroup*]
28 | [\--master-capable=``yes|no``] [\--vm-capable=``yes|no``]
29 | [\--node-parameters *ndparams*]
30 | [\--disk-state *diskstate*]
31 | [\--hypervisor-state *hvstate*]
32 | {*nodename*}
33
34 Adds the given node to the cluster.
35
36 This command is used to join a new node to the cluster. You will
37 have to provide the password for root of the node to be able to add
38 the node in the cluster. The command needs to be run on the Ganeti
39 master.
40
41 Note that the command is potentially destructive, as it will
42 forcibly join the specified host to the cluster, not paying attention
43 to its current status (it could be already in a cluster, etc.)
44
45 The ``-s (--secondary-ip)`` is used in dual-home clusters and
46 specifies the new node's IP in the secondary network. See the
47 discussion in **gnt-cluster**\(8) for more information.
48
49 In case you're readding a node after hardware failure, you can use
50 the ``--readd`` parameter. In this case, you don't need to pass the
51 secondary IP again, it will be reused from the cluster. Also, the
52 drained and offline flags of the node will be cleared before
53 re-adding it.
54
55 The ``-g (--node-group)`` option is used to add the new node into a
56 specific node group, specified by UUID or name. If only one node group
57 exists you can skip this option, otherwise it's mandatory.
58
59 The ``vm_capable``, ``master_capable``, ``ndparams``, ``diskstate`` and
60 ``hvstate`` options are described in **ganeti**\(7), and are used to set
61 the properties of the new node.
62
63 The command performs some operations that change the state of the master
64 and the new node, like copying certificates and starting the node daemon
65 on the new node, or updating ``/etc/hosts`` on the master node.  If the
66 command fails at a later stage, it doesn't undo such changes.  This
67 should not be a problem, as a successful run of ``gnt-node add`` will
68 bring everything back in sync.
69
70 If the node was previously part of another cluster and still has daemons
71 running, the ``node-cleanup`` tool can be run on the machine to be added
72 to clean remains of the previous cluster from the node.
73
74 Example::
75
76     # gnt-node add node5.example.com
77     # gnt-node add -s 192.0.2.5 node5.example.com
78     # gnt-node add -g group2 -s 192.0.2.9 node9.group2.example.com
79
80
81 EVACUATE
82 ~~~~~~~~
83
84 | **evacuate** [-f] [\--early-release] [\--submit] [\--print-job-id]
85 | [{-I|\--iallocator} *NAME* \| {-n|\--new-secondary} *destination\_node*]
86 | [{-p|\--primary-only} \| {-s|\--secondary-only} ]
87 |  {*node*}
88
89 This command will move instances away from the given node. If
90 ``--primary-only`` is given, only primary instances are evacuated, with
91 ``--secondary-only`` only secondaries. If neither is given, all
92 instances are evacuated. It works only for instances having a drbd disk
93 template.
94
95 The new location for the instances can be specified in two ways:
96
97 - as a single node for all instances, via the ``-n (--new-secondary)``
98   option
99
100 - or via the ``-I (--iallocator)`` option, giving a script name as
101   parameter (or ``.`` to use the default allocator), so each instance
102   will be in turn placed on the (per the script) optimal node
103
104 The ``--early-release`` changes the code so that the old storage on
105 node being evacuated is removed early (before the resync is
106 completed) and the internal Ganeti locks are also released for both
107 the current secondary and the new secondary, thus allowing more
108 parallelism in the cluster operation. This should be used only when
109 recovering from a disk failure on the current secondary (thus the
110 old storage is already broken) or when the storage on the primary
111 node is known to be fine (thus we won't need the old storage for
112 potential recovery).
113
114 Note that this command is equivalent to using per-instance commands for
115 each affected instance individually:
116
117 - ``--primary-only`` is equivalent to performing ``gnt-instance
118   migrate`` for every primary instance running on the node that can be
119   migrated and ``gnt-instance failover`` for every primary instance that
120   cannot be migrated.
121 - ``--secondary-only`` is equivalent to ``gnt-instance replace-disks``
122   in secondary node change mode (``--new-secondary``) for every DRBD
123   instance that the node is a secondary for.
124 - when neither of the above is done a combination of the two cases is run
125
126 Note that the iallocator currently only considers disk information of
127 the default disk template, even if the instance's disk templates differ
128 from that.
129
130 See **ganeti**\(7) for a description of ``--submit`` and other common
131 options.
132
133 Example::
134
135     # gnt-node evacuate -I hail node3.example.com
136
137 Note that, due to an issue with the iallocator interface, evacuation of
138 all instances at once is not yet implemented. Full evacuation can
139 currently be achieved by sequentially evacuating primaries and
140 secondaries.
141 ::
142
143     # gnt-node evacuate -p node3.example.com
144     # gnt-node evacuate -s node3.example.com
145
146
147 FAILOVER
148 ~~~~~~~~
149
150 **failover** [-f] [\--ignore-consistency] {*node*}
151
152 This command will fail over all instances having the given node as
153 primary to their secondary nodes. This works only for instances having
154 a drbd disk template.
155
156 Normally the failover will check the consistency of the disks before
157 failing over the instance. If you are trying to migrate instances off
158 a dead node, this will fail. Use the ``--ignore-consistency`` option
159 for this purpose.
160
161 Example::
162
163     # gnt-node failover node1.example.com
164
165
166 INFO
167 ~~~~
168
169 **info** [*node*...]
170
171 Show detailed information about the nodes in the cluster. If you
172 don't give any arguments, all nodes will be shows, otherwise the
173 output will be restricted to the given names.
174
175 LIST
176 ~~~~
177
178 | **list**
179 | [\--no-headers] [\--separator=*SEPARATOR*]
180 | [\--units=*UNITS*] [-v] [{-o|\--output} *[+]FIELD,...*]
181 | [\--filter]
182 | [node...]
183
184 Lists the nodes in the cluster.
185
186 The ``--no-headers`` option will skip the initial header line. The
187 ``--separator`` option takes an argument which denotes what will be
188 used between the output fields. Both these options are to help
189 scripting.
190
191 The units used to display the numeric values in the output varies,
192 depending on the options given. By default, the values will be
193 formatted in the most appropriate unit. If the ``--separator``
194 option is given, then the values are shown in mebibytes to allow
195 parsing by scripts. In both cases, the ``--units`` option can be
196 used to enforce a given output unit.
197
198 Queries of nodes will be done in parallel with any running jobs. This might
199 give inconsistent results for the free disk/memory.
200
201 The ``-v`` option activates verbose mode, which changes the display of
202 special field states (see **ganeti**\(7)).
203
204 The ``-o (--output)`` option takes a comma-separated list of output
205 fields. The available fields and their meaning are:
206
207 @QUERY_FIELDS_NODE@
208
209 If the value of the option starts with the character ``+``, the new
210 fields will be added to the default list. This allows one to quickly
211 see the default list plus a few other fields, instead of retyping
212 the entire list of fields.
213
214 Note that some of these fields are known from the configuration of the
215 cluster (e.g. ``name``, ``pinst``, ``sinst``, ``pip``, ``sip``) and thus
216 the master does not need to contact the node for this data (making the
217 listing fast if only fields from this set are selected), whereas the
218 other fields are "live" fields and require a query to the cluster nodes.
219
220 Depending on the virtualization type and implementation details, the
221 ``mtotal``, ``mnode`` and ``mfree`` fields may have slightly varying
222 meanings. For example, some solutions share the node memory with the
223 pool of memory used for instances (KVM), whereas others have separate
224 memory for the node and for the instances (Xen).
225
226 Note that the field 'dtotal' and 'dfree' refer to the storage type
227 that is defined by the default disk template. The default disk template
228 is the first on in the list of cluster-wide enabled disk templates and
229 can be set with ``gnt-cluster modify``. Currently, only the disk
230 templates 'plain', 'drbd', 'file', and 'sharedfile' support storage
231 reporting, for all others '0' is displayed.
232
233 If exactly one argument is given and it appears to be a query filter
234 (see **ganeti**\(7)), the query result is filtered accordingly. For
235 ambiguous cases (e.g. a single field name as a filter) the ``--filter``
236 (``-F``) option forces the argument to be treated as a filter (e.g.
237 ``gnt-node list -F master_candidate``).
238
239 If no node names are given, then all nodes are queried. Otherwise,
240 only the given nodes will be listed.
241
242
243 LIST-DRBD
244 ~~~~~~~~~
245
246 **list-drbd** [\--no-headers] [\--separator=*SEPARATOR*] node
247
248 Lists the mapping of DRBD minors for a given node. This outputs a static
249 list of fields (it doesn't accept the ``--output`` option), as follows:
250
251 ``Node``
252   The (full) name of the node we are querying
253 ``Minor``
254   The DRBD minor
255 ``Instance``
256   The instance the DRBD minor belongs to
257 ``Disk``
258   The disk index that the DRBD minor belongs to
259 ``Role``
260   Either ``primary`` or ``secondary``, denoting the role of the node for
261   the instance (note: this is not the live status of the DRBD device,
262   but the configuration value)
263 ``PeerNode``
264   The node that the minor is connected to on the other end
265
266 This command can be used as a reverse lookup (from node and minor) to a
267 given instance, which can be useful when debugging DRBD issues.
268
269 Note that this command queries Ganeti via **ganeti-confd**\(8), so
270 it won't be available if support for ``confd`` has not been enabled at
271 build time; furthermore, in Ganeti 2.6 this is only available via the
272 Haskell version of confd (again selected at build time).
273
274 LIST-FIELDS
275 ~~~~~~~~~~~
276
277 **list-fields** [field...]
278
279 Lists available fields for nodes.
280
281
282 MIGRATE
283 ~~~~~~~
284
285 | **migrate** [-f] [\--non-live] [\--migration-mode=live\|non-live]
286 | [\--ignore-ipolicy] [\--submit] [\--print-job-id] {*node*}
287
288 This command will migrate all instances having the given node as
289 primary to their secondary nodes. This works only for instances
290 having a drbd disk template.
291
292 As for the **gnt-instance migrate** command, the options
293 ``--no-live``, ``--migration-mode`` and ``--no-runtime-changes``
294 can be given to influence the migration type.
295
296 If ``--ignore-ipolicy`` is given any instance policy violations
297 occurring during this operation are ignored.
298
299 See **ganeti**\(7) for a description of ``--submit`` and other common
300 options.
301
302 Example::
303
304     # gnt-node migrate node1.example.com
305
306
307 MODIFY
308 ~~~~~~
309
310 | **modify** [-f] [\--submit] [\--print-job-id]
311 | [{-C|\--master-candidate} ``yes|no``]
312 | [{-D|\--drained} ``yes|no``] [{-O|\--offline} ``yes|no``]
313 | [\--master-capable=``yes|no``] [\--vm-capable=``yes|no``] [\--auto-promote]
314 | [{-s|\--secondary-ip} *secondary_ip*]
315 | [\--node-parameters *ndparams*]
316 | [\--node-powered=``yes|no``]
317 | [\--hypervisor-state *hvstate*]
318 | [\--disk-state *diskstate*]
319 | {*node*}
320
321 This command changes the role of the node. Each options takes
322 either a literal yes or no, and only one option should be given as
323 yes. The meaning of the roles and flags are described in the
324 manpage **ganeti**\(7).
325
326 The option ``--node-powered`` can be used to modify state-of-record if
327 it doesn't reflect the reality anymore.
328
329 In case a node is demoted from the master candidate role, the
330 operation will be refused unless you pass the ``--auto-promote``
331 option. This option will cause the operation to lock all cluster nodes
332 (thus it will not be able to run in parallel with most other jobs),
333 but it allows automated maintenance of the cluster candidate pool. If
334 locking all cluster node is too expensive, another option is to
335 promote manually another node to master candidate before demoting the
336 current one.
337
338 Example (setting a node offline, which will demote it from master
339 candidate role if is in that role)::
340
341     # gnt-node modify --offline=yes node1.example.com
342
343 The ``-s (--secondary-ip)`` option can be used to change the node's
344 secondary ip. No drbd instances can be running on the node, while this
345 operation is taking place. Remember that the secondary ip must be
346 reachable from the master secondary ip, when being changed, so be sure
347 that the node has the new IP already configured and active. In order to
348 convert a cluster from single homed to multi-homed or vice versa
349 ``--force`` is needed as well, and the target node for the first change
350 must be the master.
351
352 See **ganeti**\(7) for a description of ``--submit`` and other common
353 options.
354
355 Example (setting the node back to online and master candidate)::
356
357     # gnt-node modify --offline=no --master-candidate=yes node1.example.com
358
359
360 REMOVE
361 ~~~~~~
362
363 **remove** {*nodename*}
364
365 Removes a node from the cluster. Instances must be removed or
366 migrated to another cluster before.
367
368 Example::
369
370     # gnt-node remove node5.example.com
371
372
373 VOLUMES
374 ~~~~~~~
375
376 | **volumes** [\--no-headers] [\--human-readable]
377 | [\--separator=*SEPARATOR*] [{-o|\--output} *FIELDS*]
378 | [*node*...]
379
380 Lists all logical volumes and their physical disks from the node(s)
381 provided.
382
383 The ``--no-headers`` option will skip the initial header line. The
384 ``--separator`` option takes an argument which denotes what will be
385 used between the output fields. Both these options are to help
386 scripting.
387
388 The units used to display the numeric values in the output varies,
389 depending on the options given. By default, the values will be
390 formatted in the most appropriate unit. If the ``--separator``
391 option is given, then the values are shown in mebibytes to allow
392 parsing by scripts. In both cases, the ``--units`` option can be
393 used to enforce a given output unit.
394
395 The ``-o (--output)`` option takes a comma-separated list of output
396 fields. The available fields and their meaning are:
397
398 node
399     the node name on which the volume exists
400
401 phys
402     the physical drive (on which the LVM physical volume lives)
403
404 vg
405     the volume group name
406
407 name
408     the logical volume name
409
410 size
411     the logical volume size
412
413 instance
414     The name of the instance to which this volume belongs, or (in case
415     it's an orphan volume) the character "-"
416
417
418 Example::
419
420     # gnt-node volumes node5.example.com
421     Node              PhysDev   VG    Name                                 Size Instance
422     node1.example.com /dev/hdc1 xenvg instance1.example.com-sda_11000.meta 128  instance1.example.com
423     node1.example.com /dev/hdc1 xenvg instance1.example.com-sda_11001.data 256  instance1.example.com
424
425
426 LIST-STORAGE
427 ~~~~~~~~~~~~
428
429 | **list-storage** [\--no-headers] [\--human-readable]
430 | [\--separator=*SEPARATOR*] [\--storage-type=*STORAGE\_TYPE*]
431 | [{-o|\--output} *FIELDS*]
432 | [*node*...]
433
434 Lists the available storage units and their details for the given
435 node(s).
436
437 The ``--no-headers`` option will skip the initial header line. The
438 ``--separator`` option takes an argument which denotes what will be
439 used between the output fields. Both these options are to help
440 scripting.
441
442 The units used to display the numeric values in the output varies,
443 depending on the options given. By default, the values will be
444 formatted in the most appropriate unit. If the ``--separator``
445 option is given, then the values are shown in mebibytes to allow
446 parsing by scripts. In both cases, the ``--units`` option can be
447 used to enforce a given output unit.
448
449 The ``--storage-type`` option can be used to choose a storage unit
450 type. Possible choices are lvm-pv, lvm-vg or file.
451
452 The ``-o (--output)`` option takes a comma-separated list of output
453 fields. The available fields and their meaning are:
454
455 node
456     the node name on which the volume exists
457
458 type
459     the type of the storage unit (currently just what is passed in via
460     ``--storage-type``)
461
462 name
463     the path/identifier of the storage unit
464
465 size
466     total size of the unit; for the file type see a note below
467
468 used
469     used space in the unit; for the file type see a note below
470
471 free
472     available disk space
473
474 allocatable
475     whether we the unit is available for allocation (only lvm-pv can
476     change this setting, the other types always report true)
477
478
479 Note that for the "file" type, the total disk space might not equal
480 to the sum of used and free, due to the method Ganeti uses to
481 compute each of them. The total and free values are computed as the
482 total and free space values for the filesystem to which the
483 directory belongs, but the used space is computed from the used
484 space under that directory *only*, which might not be necessarily
485 the root of the filesystem, and as such there could be files
486 outside the file storage directory using disk space and causing a
487 mismatch in the values.
488
489 Example::
490
491     node1# gnt-node list-storage node2
492     Node  Type   Name        Size Used   Free Allocatable
493     node2 lvm-pv /dev/sda7 673.8G 1.5G 672.3G Y
494     node2 lvm-pv /dev/sdb1 698.6G   0M 698.6G Y
495
496
497 MODIFY-STORAGE
498 ~~~~~~~~~~~~~~
499
500 | **modify-storage** [\--allocatable={yes|no}] [\--submit] [\--print-job-id]
501 | {*node*} {*storage-type*} {*volume-name*}
502
503 Modifies storage volumes on a node. Only LVM physical volumes can
504 be modified at the moment. They have a storage type of "lvm-pv".
505
506 Example::
507
508     # gnt-node modify-storage --allocatable no node5.example.com lvm-pv /dev/sdb1
509
510
511 REPAIR-STORAGE
512 ~~~~~~~~~~~~~~
513
514 | **repair-storage** [\--ignore-consistency] ]\--submit]
515 | {*node*} {*storage-type*} {*volume-name*}
516
517 Repairs a storage volume on a node. Only LVM volume groups can be
518 repaired at this time. They have the storage type "lvm-vg".
519
520 On LVM volume groups, **repair-storage** runs ``vgreduce
521 --removemissing``.
522
523
524
525 **Caution:** Running this command can lead to data loss. Use it with
526 care.
527
528 The ``--ignore-consistency`` option will ignore any inconsistent
529 disks (on the nodes paired with this one). Use of this option is
530 most likely to lead to data-loss.
531
532 Example::
533
534     # gnt-node repair-storage node5.example.com lvm-vg xenvg
535
536
537 POWERCYCLE
538 ~~~~~~~~~~
539
540 **powercycle** [\--yes] [\--force] [\--submit] [\--print-job-id] {*node*}
541
542 This command (tries to) forcefully reboot a node. It is a command
543 that can be used if the node environment is broken, such that the
544 admin can no longer login over SSH, but the Ganeti node daemon is
545 still working.
546
547 Note that this command is not guaranteed to work; it depends on the
548 hypervisor how effective is the reboot attempt. For Linux, this
549 command requires the kernel option ``CONFIG_MAGIC_SYSRQ`` to be
550 enabled.
551
552 The ``--yes`` option can be used to skip confirmation, while the
553 ``--force`` option is needed if the target node is the master
554 node.
555
556 See **ganeti**\(7) for a description of ``--submit`` and other common
557 options.
558
559 POWER
560 ~~~~~
561
562 **power** [``--force``] [``--ignore-status``] [``--all``]
563 [``--power-delay``] on|off|cycle|status [*nodes*]
564
565 This command calls out to out-of-band management to change the power
566 state of given node. With ``status`` you get the power status as reported
567 by the out-of-band management script.
568
569 Note that this command will only work if the out-of-band functionality
570 is configured and enabled on the cluster. If this is not the case,
571 please use the **powercycle** command above.
572
573 Using ``--force`` you skip the confirmation to do the operation.
574 Currently this only has effect on ``off`` and ``cycle``. On those two
575 you can *not* operate on the master. However, the command will provide
576 you with the command to invoke to operate on the master nerver-mind.
577 This is considered harmful and Ganeti does not support the use of it.
578
579 Providing ``--ignore-status`` will ignore the offline=N state of a node
580 and continue with power off.
581
582 ``--power-delay`` specifies the time in seconds (factions allowed)
583 waited between powering on the next node. This is by default 2 seconds
584 but can increased if needed with this option.
585
586 *nodes* are optional. If not provided it will call out for every node in
587 the cluster. Except for the ``off`` and ``cycle`` command where you've
588 to explicit use ``--all`` to select all.
589
590
591 HEALTH
592 ~~~~~~
593
594 **health** [*nodes*]
595
596 This command calls out to out-of-band management to ask for the health status
597 of all or given nodes. The health contains the node name and then the items
598 element with their status in a ``item=status`` manner. Where ``item`` is script
599 specific and ``status`` can be one of ``OK``, ``WARNING``, ``CRITICAL`` or
600 ``UNKNOWN``. Items with status ``WARNING`` or ``CRITICAL`` are logged and
601 annotated in the command line output.
602
603
604 RESTRICTED-COMMAND
605 ~~~~~~~~~~~~~~~~~~
606
607 | **restricted-command** [-M] [\--sync]
608 | { -g *group* *command* | *command* *nodes*... }
609
610 Executes a restricted command on the specified nodes. Restricted commands are
611 not arbitrary, but must reside in
612 ``@SYSCONFDIR@/ganeti/restricted-commands`` on a node, either as a regular
613 file or as a symlink. The directory must be owned by root and not be
614 world- or group-writable. If a command fails verification or otherwise
615 fails to start, the node daemon log must be consulted for more detailed
616 information.
617
618 Example for running a command on two nodes::
619
620     # gnt-node restricted-command mycommand \
621       node1.example.com node2.example.com
622
623 The ``-g`` option can be used to run a command only on a specific node
624 group, e.g.::
625
626     # gnt-node restricted-command -g default mycommand
627
628 The ``-M`` option can be used to prepend the node name to all command
629 output lines. ``--sync`` forces the opcode to acquire the node lock(s)
630 in exclusive mode.
631
632 Tags
633 ~~~~
634
635 ADD-TAGS
636 ^^^^^^^^
637
638 **add-tags** [\--from *file*] {*nodename*} {*tag*...}
639
640 Add tags to the given node. If any of the tags contains invalid
641 characters, the entire operation will abort.
642
643 If the ``--from`` option is given, the list of tags will be
644 extended with the contents of that file (each line becomes a tag).
645 In this case, there is not need to pass tags on the command line
646 (if you do, both sources will be used). A file name of - will be
647 interpreted as stdin.
648
649 LIST-TAGS
650 ^^^^^^^^^
651
652 **list-tags** {*nodename*}
653
654 List the tags of the given node.
655
656 REMOVE-TAGS
657 ^^^^^^^^^^^
658
659 **remove-tags** [\--from *file*] {*nodename*} {*tag*...}
660
661 Remove tags from the given node. If any of the tags are not
662 existing on the node, the entire operation will abort.
663
664 If the ``--from`` option is given, the list of tags to be removed will
665 be extended with the contents of that file (each line becomes a tag).
666 In this case, there is not need to pass tags on the command line (if
667 you do, tags from both sources will be removed). A file name of - will
668 be interpreted as stdin.
669
670 .. vim: set textwidth=72 :
671 .. Local Variables:
672 .. mode: rst
673 .. fill-column: 72
674 .. End: