Merge remote branch 'origin/devel-2.1'
[ganeti-local] / lib / opcodes.py
1 #
2 #
3
4 # Copyright (C) 2006, 2007 Google Inc.
5 #
6 # This program is free software; you can redistribute it and/or modify
7 # it under the terms of the GNU General Public License as published by
8 # the Free Software Foundation; either version 2 of the License, or
9 # (at your option) any later version.
10 #
11 # This program is distributed in the hope that it will be useful, but
12 # WITHOUT ANY WARRANTY; without even the implied warranty of
13 # MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
14 # General Public License for more details.
15 #
16 # You should have received a copy of the GNU General Public License
17 # along with this program; if not, write to the Free Software
18 # Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA
19 # 02110-1301, USA.
20
21
22 """OpCodes module
23
24 This module implements the data structures which define the cluster
25 operations - the so-called opcodes.
26
27 Every operation which modifies the cluster state is expressed via
28 opcodes.
29
30 """
31
32 # this are practically structures, so disable the message about too
33 # few public methods:
34 # pylint: disable-msg=R0903
35
36
37 class BaseOpCode(object):
38   """A simple serializable object.
39
40   This object serves as a parent class for OpCode without any custom
41   field handling.
42
43   """
44   __slots__ = []
45
46   def __init__(self, **kwargs):
47     """Constructor for BaseOpCode.
48
49     The constructor takes only keyword arguments and will set
50     attributes on this object based on the passed arguments. As such,
51     it means that you should not pass arguments which are not in the
52     __slots__ attribute for this class.
53
54     """
55     slots = self._all_slots()
56     for key in kwargs:
57       if key not in slots:
58         raise TypeError("Object %s doesn't support the parameter '%s'" %
59                         (self.__class__.__name__, key))
60       setattr(self, key, kwargs[key])
61
62   def __getstate__(self):
63     """Generic serializer.
64
65     This method just returns the contents of the instance as a
66     dictionary.
67
68     @rtype:  C{dict}
69     @return: the instance attributes and their values
70
71     """
72     state = {}
73     for name in self._all_slots():
74       if hasattr(self, name):
75         state[name] = getattr(self, name)
76     return state
77
78   def __setstate__(self, state):
79     """Generic unserializer.
80
81     This method just restores from the serialized state the attributes
82     of the current instance.
83
84     @param state: the serialized opcode data
85     @type state:  C{dict}
86
87     """
88     if not isinstance(state, dict):
89       raise ValueError("Invalid data to __setstate__: expected dict, got %s" %
90                        type(state))
91
92     for name in self._all_slots():
93       if name not in state and hasattr(self, name):
94         delattr(self, name)
95
96     for name in state:
97       setattr(self, name, state[name])
98
99   @classmethod
100   def _all_slots(cls):
101     """Compute the list of all declared slots for a class.
102
103     """
104     slots = []
105     for parent in cls.__mro__:
106       slots.extend(getattr(parent, "__slots__", []))
107     return slots
108
109
110 class OpCode(BaseOpCode):
111   """Abstract OpCode.
112
113   This is the root of the actual OpCode hierarchy. All clases derived
114   from this class should override OP_ID.
115
116   @cvar OP_ID: The ID of this opcode. This should be unique amongst all
117                children of this class.
118   @ivar dry_run: Whether the LU should be run in dry-run mode, i.e. just
119                  the check steps
120
121   """
122   OP_ID = "OP_ABSTRACT"
123   __slots__ = ["dry_run", "debug_level"]
124
125   def __getstate__(self):
126     """Specialized getstate for opcodes.
127
128     This method adds to the state dictionary the OP_ID of the class,
129     so that on unload we can identify the correct class for
130     instantiating the opcode.
131
132     @rtype:   C{dict}
133     @return:  the state as a dictionary
134
135     """
136     data = BaseOpCode.__getstate__(self)
137     data["OP_ID"] = self.OP_ID
138     return data
139
140   @classmethod
141   def LoadOpCode(cls, data):
142     """Generic load opcode method.
143
144     The method identifies the correct opcode class from the dict-form
145     by looking for a OP_ID key, if this is not found, or its value is
146     not available in this module as a child of this class, we fail.
147
148     @type data:  C{dict}
149     @param data: the serialized opcode
150
151     """
152     if not isinstance(data, dict):
153       raise ValueError("Invalid data to LoadOpCode (%s)" % type(data))
154     if "OP_ID" not in data:
155       raise ValueError("Invalid data to LoadOpcode, missing OP_ID")
156     op_id = data["OP_ID"]
157     op_class = None
158     if op_id in OP_MAPPING:
159       op_class = OP_MAPPING[op_id]
160     else:
161       raise ValueError("Invalid data to LoadOpCode: OP_ID %s unsupported" %
162                        op_id)
163     op = op_class()
164     new_data = data.copy()
165     del new_data["OP_ID"]
166     op.__setstate__(new_data)
167     return op
168
169   def Summary(self):
170     """Generates a summary description of this opcode.
171
172     """
173     # all OP_ID start with OP_, we remove that
174     txt = self.OP_ID[3:]
175     field_name = getattr(self, "OP_DSC_FIELD", None)
176     if field_name:
177       field_value = getattr(self, field_name, None)
178       txt = "%s(%s)" % (txt, field_value)
179     return txt
180
181
182 # cluster opcodes
183
184 class OpPostInitCluster(OpCode):
185   """Post cluster initialization.
186
187   This opcode does not touch the cluster at all. Its purpose is to run hooks
188   after the cluster has been initialized.
189
190   """
191   OP_ID = "OP_CLUSTER_POST_INIT"
192   __slots__ = []
193
194
195 class OpDestroyCluster(OpCode):
196   """Destroy the cluster.
197
198   This opcode has no other parameters. All the state is irreversibly
199   lost after the execution of this opcode.
200
201   """
202   OP_ID = "OP_CLUSTER_DESTROY"
203   __slots__ = []
204
205
206 class OpQueryClusterInfo(OpCode):
207   """Query cluster information."""
208   OP_ID = "OP_CLUSTER_QUERY"
209   __slots__ = []
210
211
212 class OpVerifyCluster(OpCode):
213   """Verify the cluster state.
214
215   @type skip_checks: C{list}
216   @ivar skip_checks: steps to be skipped from the verify process; this
217                      needs to be a subset of
218                      L{constants.VERIFY_OPTIONAL_CHECKS}; currently
219                      only L{constants.VERIFY_NPLUSONE_MEM} can be passed
220
221   """
222   OP_ID = "OP_CLUSTER_VERIFY"
223   __slots__ = ["skip_checks", "verbose", "error_codes",
224                "debug_simulate_errors"]
225
226
227 class OpVerifyDisks(OpCode):
228   """Verify the cluster disks.
229
230   Parameters: none
231
232   Result: a tuple of four elements:
233     - list of node names with bad data returned (unreachable, etc.)
234     - dict of node names with broken volume groups (values: error msg)
235     - list of instances with degraded disks (that should be activated)
236     - dict of instances with missing logical volumes (values: (node, vol)
237       pairs with details about the missing volumes)
238
239   In normal operation, all lists should be empty. A non-empty instance
240   list (3rd element of the result) is still ok (errors were fixed) but
241   non-empty node list means some node is down, and probably there are
242   unfixable drbd errors.
243
244   Note that only instances that are drbd-based are taken into
245   consideration. This might need to be revisited in the future.
246
247   """
248   OP_ID = "OP_CLUSTER_VERIFY_DISKS"
249   __slots__ = []
250
251
252 class OpRepairDiskSizes(OpCode):
253   """Verify the disk sizes of the instances and fixes configuration
254   mimatches.
255
256   Parameters: optional instances list, in case we want to restrict the
257   checks to only a subset of the instances.
258
259   Result: a list of tuples, (instance, disk, new-size) for changed
260   configurations.
261
262   In normal operation, the list should be empty.
263
264   @type instances: list
265   @ivar instances: the list of instances to check, or empty for all instances
266
267   """
268   OP_ID = "OP_CLUSTER_REPAIR_DISK_SIZES"
269   __slots__ = ["instances"]
270
271
272 class OpQueryConfigValues(OpCode):
273   """Query cluster configuration values."""
274   OP_ID = "OP_CLUSTER_CONFIG_QUERY"
275   __slots__ = ["output_fields"]
276
277
278 class OpRenameCluster(OpCode):
279   """Rename the cluster.
280
281   @type name: C{str}
282   @ivar name: The new name of the cluster. The name and/or the master IP
283               address will be changed to match the new name and its IP
284               address.
285
286   """
287   OP_ID = "OP_CLUSTER_RENAME"
288   OP_DSC_FIELD = "name"
289   __slots__ = ["name"]
290
291
292 class OpSetClusterParams(OpCode):
293   """Change the parameters of the cluster.
294
295   @type vg_name: C{str} or C{None}
296   @ivar vg_name: The new volume group name or None to disable LVM usage.
297
298   """
299   OP_ID = "OP_CLUSTER_SET_PARAMS"
300   __slots__ = [
301     "vg_name",
302     "enabled_hypervisors",
303     "hvparams",
304     "os_hvp",
305     "beparams",
306     "nicparams",
307     "candidate_pool_size",
308     ]
309
310
311 class OpRedistributeConfig(OpCode):
312   """Force a full push of the cluster configuration.
313
314   """
315   OP_ID = "OP_CLUSTER_REDIST_CONF"
316   __slots__ = []
317
318 # node opcodes
319
320 class OpRemoveNode(OpCode):
321   """Remove a node.
322
323   @type node_name: C{str}
324   @ivar node_name: The name of the node to remove. If the node still has
325                    instances on it, the operation will fail.
326
327   """
328   OP_ID = "OP_NODE_REMOVE"
329   OP_DSC_FIELD = "node_name"
330   __slots__ = ["node_name"]
331
332
333 class OpAddNode(OpCode):
334   """Add a node to the cluster.
335
336   @type node_name: C{str}
337   @ivar node_name: The name of the node to add. This can be a short name,
338                    but it will be expanded to the FQDN.
339   @type primary_ip: IP address
340   @ivar primary_ip: The primary IP of the node. This will be ignored when the
341                     opcode is submitted, but will be filled during the node
342                     add (so it will be visible in the job query).
343   @type secondary_ip: IP address
344   @ivar secondary_ip: The secondary IP of the node. This needs to be passed
345                       if the cluster has been initialized in 'dual-network'
346                       mode, otherwise it must not be given.
347   @type readd: C{bool}
348   @ivar readd: Whether to re-add an existing node to the cluster. If
349                this is not passed, then the operation will abort if the node
350                name is already in the cluster; use this parameter to 'repair'
351                a node that had its configuration broken, or was reinstalled
352                without removal from the cluster.
353
354   """
355   OP_ID = "OP_NODE_ADD"
356   OP_DSC_FIELD = "node_name"
357   __slots__ = ["node_name", "primary_ip", "secondary_ip", "readd"]
358
359
360 class OpQueryNodes(OpCode):
361   """Compute the list of nodes."""
362   OP_ID = "OP_NODE_QUERY"
363   __slots__ = ["output_fields", "names", "use_locking"]
364
365
366 class OpQueryNodeVolumes(OpCode):
367   """Get list of volumes on node."""
368   OP_ID = "OP_NODE_QUERYVOLS"
369   __slots__ = ["nodes", "output_fields"]
370
371
372 class OpQueryNodeStorage(OpCode):
373   """Get information on storage for node(s)."""
374   OP_ID = "OP_NODE_QUERY_STORAGE"
375   __slots__ = [
376     "nodes",
377     "storage_type",
378     "name",
379     "output_fields",
380     ]
381
382
383 class OpModifyNodeStorage(OpCode):
384   """Modifies the properies of a storage unit"""
385   OP_ID = "OP_NODE_MODIFY_STORAGE"
386   __slots__ = [
387     "node_name",
388     "storage_type",
389     "name",
390     "changes",
391     ]
392
393
394 class OpRepairNodeStorage(OpCode):
395   """Repairs the volume group on a node."""
396   OP_ID = "OP_REPAIR_NODE_STORAGE"
397   OP_DSC_FIELD = "node_name"
398   __slots__ = [
399     "node_name",
400     "storage_type",
401     "name",
402     "ignore_consistency",
403     ]
404
405
406 class OpSetNodeParams(OpCode):
407   """Change the parameters of a node."""
408   OP_ID = "OP_NODE_SET_PARAMS"
409   OP_DSC_FIELD = "node_name"
410   __slots__ = [
411     "node_name",
412     "force",
413     "master_candidate",
414     "offline",
415     "drained",
416     "auto_promote",
417     ]
418
419
420 class OpPowercycleNode(OpCode):
421   """Tries to powercycle a node."""
422   OP_ID = "OP_NODE_POWERCYCLE"
423   OP_DSC_FIELD = "node_name"
424   __slots__ = [
425     "node_name",
426     "force",
427     ]
428
429
430 class OpEvacuateNode(OpCode):
431   """Relocate secondary instances from a node."""
432   OP_ID = "OP_NODE_EVACUATE"
433   OP_DSC_FIELD = "node_name"
434   __slots__ = [
435     "node_name", "remote_node", "iallocator", "early_release",
436     ]
437
438
439 class OpMigrateNode(OpCode):
440   """Migrate all instances from a node."""
441   OP_ID = "OP_NODE_MIGRATE"
442   OP_DSC_FIELD = "node_name"
443   __slots__ = [
444     "node_name",
445     "live",
446     ]
447
448
449 class OpNodeEvacuationStrategy(OpCode):
450   """Compute the evacuation strategy for a list of nodes."""
451   OP_ID = "OP_NODE_EVAC_STRATEGY"
452   OP_DSC_FIELD = "nodes"
453   __slots__ = ["nodes", "iallocator", "remote_node"]
454
455
456 # instance opcodes
457
458 class OpCreateInstance(OpCode):
459   """Create an instance."""
460   OP_ID = "OP_INSTANCE_CREATE"
461   OP_DSC_FIELD = "instance_name"
462   __slots__ = [
463     "instance_name", "os_type", "force_variant",
464     "pnode", "disk_template", "snode", "mode",
465     "disks", "nics",
466     "src_node", "src_path", "start",
467     "wait_for_sync", "ip_check", "name_check",
468     "file_storage_dir", "file_driver",
469     "iallocator",
470     "hypervisor", "hvparams", "beparams",
471     "dry_run",
472     ]
473
474
475 class OpReinstallInstance(OpCode):
476   """Reinstall an instance's OS."""
477   OP_ID = "OP_INSTANCE_REINSTALL"
478   OP_DSC_FIELD = "instance_name"
479   __slots__ = ["instance_name", "os_type", "force_variant"]
480
481
482 class OpRemoveInstance(OpCode):
483   """Remove an instance."""
484   OP_ID = "OP_INSTANCE_REMOVE"
485   OP_DSC_FIELD = "instance_name"
486   __slots__ = [
487     "instance_name",
488     "ignore_failures",
489     "shutdown_timeout",
490     ]
491
492
493 class OpRenameInstance(OpCode):
494   """Rename an instance."""
495   OP_ID = "OP_INSTANCE_RENAME"
496   __slots__ = [
497     "instance_name", "ignore_ip", "new_name",
498     ]
499
500
501 class OpStartupInstance(OpCode):
502   """Startup an instance."""
503   OP_ID = "OP_INSTANCE_STARTUP"
504   OP_DSC_FIELD = "instance_name"
505   __slots__ = [
506     "instance_name", "force", "hvparams", "beparams",
507     ]
508
509
510 class OpShutdownInstance(OpCode):
511   """Shutdown an instance."""
512   OP_ID = "OP_INSTANCE_SHUTDOWN"
513   OP_DSC_FIELD = "instance_name"
514   __slots__ = ["instance_name", "timeout"]
515
516
517 class OpRebootInstance(OpCode):
518   """Reboot an instance."""
519   OP_ID = "OP_INSTANCE_REBOOT"
520   OP_DSC_FIELD = "instance_name"
521   __slots__ = [
522     "instance_name", "reboot_type", "ignore_secondaries", "shutdown_timeout",
523     ]
524
525
526 class OpReplaceDisks(OpCode):
527   """Replace the disks of an instance."""
528   OP_ID = "OP_INSTANCE_REPLACE_DISKS"
529   OP_DSC_FIELD = "instance_name"
530   __slots__ = [
531     "instance_name", "remote_node", "mode", "disks", "iallocator",
532     "early_release",
533     ]
534
535
536 class OpFailoverInstance(OpCode):
537   """Failover an instance."""
538   OP_ID = "OP_INSTANCE_FAILOVER"
539   OP_DSC_FIELD = "instance_name"
540   __slots__ = [
541     "instance_name", "ignore_consistency", "shutdown_timeout",
542     ]
543
544
545 class OpMigrateInstance(OpCode):
546   """Migrate an instance.
547
548   This migrates (without shutting down an instance) to its secondary
549   node.
550
551   @ivar instance_name: the name of the instance
552
553   """
554   OP_ID = "OP_INSTANCE_MIGRATE"
555   OP_DSC_FIELD = "instance_name"
556   __slots__ = ["instance_name", "live", "cleanup"]
557
558
559 class OpMoveInstance(OpCode):
560   """Move an instance.
561
562   This move (with shutting down an instance and data copying) to an
563   arbitrary node.
564
565   @ivar instance_name: the name of the instance
566   @ivar target_node: the destination node
567
568   """
569   OP_ID = "OP_INSTANCE_MOVE"
570   OP_DSC_FIELD = "instance_name"
571   __slots__ = [
572     "instance_name", "target_node", "shutdown_timeout",
573     ]
574
575
576 class OpConnectConsole(OpCode):
577   """Connect to an instance's console."""
578   OP_ID = "OP_INSTANCE_CONSOLE"
579   OP_DSC_FIELD = "instance_name"
580   __slots__ = ["instance_name"]
581
582
583 class OpActivateInstanceDisks(OpCode):
584   """Activate an instance's disks."""
585   OP_ID = "OP_INSTANCE_ACTIVATE_DISKS"
586   OP_DSC_FIELD = "instance_name"
587   __slots__ = ["instance_name", "ignore_size"]
588
589
590 class OpDeactivateInstanceDisks(OpCode):
591   """Deactivate an instance's disks."""
592   OP_ID = "OP_INSTANCE_DEACTIVATE_DISKS"
593   OP_DSC_FIELD = "instance_name"
594   __slots__ = ["instance_name"]
595
596
597 class OpRecreateInstanceDisks(OpCode):
598   """Deactivate an instance's disks."""
599   OP_ID = "OP_INSTANCE_RECREATE_DISKS"
600   OP_DSC_FIELD = "instance_name"
601   __slots__ = ["instance_name", "disks"]
602
603
604 class OpQueryInstances(OpCode):
605   """Compute the list of instances."""
606   OP_ID = "OP_INSTANCE_QUERY"
607   __slots__ = ["output_fields", "names", "use_locking"]
608
609
610 class OpQueryInstanceData(OpCode):
611   """Compute the run-time status of instances."""
612   OP_ID = "OP_INSTANCE_QUERY_DATA"
613   __slots__ = ["instances", "static"]
614
615
616 class OpSetInstanceParams(OpCode):
617   """Change the parameters of an instance."""
618   OP_ID = "OP_INSTANCE_SET_PARAMS"
619   OP_DSC_FIELD = "instance_name"
620   __slots__ = [
621     "instance_name",
622     "hvparams", "beparams", "force",
623     "nics", "disks",
624     ]
625
626
627 class OpGrowDisk(OpCode):
628   """Grow a disk of an instance."""
629   OP_ID = "OP_INSTANCE_GROW_DISK"
630   OP_DSC_FIELD = "instance_name"
631   __slots__ = [
632     "instance_name", "disk", "amount", "wait_for_sync",
633     ]
634
635
636 # OS opcodes
637 class OpDiagnoseOS(OpCode):
638   """Compute the list of guest operating systems."""
639   OP_ID = "OP_OS_DIAGNOSE"
640   __slots__ = ["output_fields", "names"]
641
642
643 # Exports opcodes
644 class OpQueryExports(OpCode):
645   """Compute the list of exported images."""
646   OP_ID = "OP_BACKUP_QUERY"
647   __slots__ = ["nodes", "use_locking"]
648
649
650 class OpExportInstance(OpCode):
651   """Export an instance."""
652   OP_ID = "OP_BACKUP_EXPORT"
653   OP_DSC_FIELD = "instance_name"
654   __slots__ = [
655     "instance_name", "target_node", "shutdown", "shutdown_timeout",
656     "remove_instance",
657     "ignore_remove_failures",
658     ]
659
660
661 class OpRemoveExport(OpCode):
662   """Remove an instance's export."""
663   OP_ID = "OP_BACKUP_REMOVE"
664   OP_DSC_FIELD = "instance_name"
665   __slots__ = ["instance_name"]
666
667
668 # Tags opcodes
669 class OpGetTags(OpCode):
670   """Returns the tags of the given object."""
671   OP_ID = "OP_TAGS_GET"
672   OP_DSC_FIELD = "name"
673   __slots__ = ["kind", "name"]
674
675
676 class OpSearchTags(OpCode):
677   """Searches the tags in the cluster for a given pattern."""
678   OP_ID = "OP_TAGS_SEARCH"
679   OP_DSC_FIELD = "pattern"
680   __slots__ = ["pattern"]
681
682
683 class OpAddTags(OpCode):
684   """Add a list of tags on a given object."""
685   OP_ID = "OP_TAGS_SET"
686   __slots__ = ["kind", "name", "tags"]
687
688
689 class OpDelTags(OpCode):
690   """Remove a list of tags from a given object."""
691   OP_ID = "OP_TAGS_DEL"
692   __slots__ = ["kind", "name", "tags"]
693
694
695 # Test opcodes
696 class OpTestDelay(OpCode):
697   """Sleeps for a configured amount of time.
698
699   This is used just for debugging and testing.
700
701   Parameters:
702     - duration: the time to sleep
703     - on_master: if true, sleep on the master
704     - on_nodes: list of nodes in which to sleep
705
706   If the on_master parameter is true, it will execute a sleep on the
707   master (before any node sleep).
708
709   If the on_nodes list is not empty, it will sleep on those nodes
710   (after the sleep on the master, if that is enabled).
711
712   As an additional feature, the case of duration < 0 will be reported
713   as an execution error, so this opcode can be used as a failure
714   generator. The case of duration == 0 will not be treated specially.
715
716   """
717   OP_ID = "OP_TEST_DELAY"
718   OP_DSC_FIELD = "duration"
719   __slots__ = ["duration", "on_master", "on_nodes"]
720
721
722 class OpTestAllocator(OpCode):
723   """Allocator framework testing.
724
725   This opcode has two modes:
726     - gather and return allocator input for a given mode (allocate new
727       or replace secondary) and a given instance definition (direction
728       'in')
729     - run a selected allocator for a given operation (as above) and
730       return the allocator output (direction 'out')
731
732   """
733   OP_ID = "OP_TEST_ALLOCATOR"
734   OP_DSC_FIELD = "allocator"
735   __slots__ = [
736     "direction", "mode", "allocator", "name",
737     "mem_size", "disks", "disk_template",
738     "os", "tags", "nics", "vcpus", "hypervisor",
739     "evac_nodes",
740     ]
741
742
743 OP_MAPPING = dict([(v.OP_ID, v) for v in globals().values()
744                    if (isinstance(v, type) and issubclass(v, OpCode) and
745                        hasattr(v, "OP_ID"))])