Implement base checkFn/prepFn/execFn model for daemons
[ganeti-local] / lib / errors.py
1 #
2 #
3
4 # Copyright (C) 2006, 2007, 2008, 2009, 2010, 2011, 2012 Google Inc.
5 #
6 # This program is free software; you can redistribute it and/or modify
7 # it under the terms of the GNU General Public License as published by
8 # the Free Software Foundation; either version 2 of the License, or
9 # (at your option) any later version.
10 #
11 # This program is distributed in the hope that it will be useful, but
12 # WITHOUT ANY WARRANTY; without even the implied warranty of
13 # MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
14 # General Public License for more details.
15 #
16 # You should have received a copy of the GNU General Public License
17 # along with this program; if not, write to the Free Software
18 # Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA
19 # 02110-1301, USA.
20
21
22 """Ganeti exception handling"""
23
24
25 # OpPrereqError failure types
26
27 # resolver errors
28 ECODE_RESOLVER = "resolver_error"
29 # not enough resources (iallocator failure, disk space, memory, etc.)
30 ECODE_NORES = "insufficient_resources"
31 # wrong arguments (at syntax level)
32 ECODE_INVAL = "wrong_input"
33 # wrong entity state
34 ECODE_STATE = "wrong_state"
35 # entity not found
36 ECODE_NOENT = "unknown_entity"
37 # entity already exists
38 ECODE_EXISTS = "already_exists"
39 # resource not unique (e.g. MAC or IP duplication)
40 ECODE_NOTUNIQUE = "resource_not_unique"
41 # internal cluster error
42 ECODE_FAULT = "internal_error"
43 # environment error (e.g. node disk error)
44 ECODE_ENVIRON = "environment_error"
45
46 #: List of all failure types
47 ECODE_ALL = frozenset([
48   ECODE_RESOLVER,
49   ECODE_NORES,
50   ECODE_INVAL,
51   ECODE_STATE,
52   ECODE_NOENT,
53   ECODE_EXISTS,
54   ECODE_NOTUNIQUE,
55   ECODE_FAULT,
56   ECODE_ENVIRON,
57   ])
58
59
60 class GenericError(Exception):
61   """Base exception for Ganeti.
62
63   """
64
65
66 class LockError(GenericError):
67   """Lock error exception.
68
69   This signifies problems in the locking subsystem.
70
71   """
72
73
74 class PidFileLockError(LockError):
75   """PID file is already locked by another process.
76
77   """
78
79
80 class HypervisorError(GenericError):
81   """Hypervisor-related exception.
82
83   This is raised in case we can't communicate with the hypervisor
84   properly.
85
86   """
87
88
89 class ProgrammerError(GenericError):
90   """Programming-related error.
91
92   This is raised in cases we determine that the calling conventions
93   have been violated, meaning we got some desynchronisation between
94   parts of our code. It signifies a real programming bug.
95
96   """
97
98
99 class BlockDeviceError(GenericError):
100   """Block-device related exception.
101
102   This is raised in case we can't setup the instance's block devices
103   properly.
104
105   """
106
107
108 class ConfigurationError(GenericError):
109   """Configuration related exception.
110
111   Things like having an instance with a primary node that doesn't
112   exist in the config or such raise this exception.
113
114   """
115
116
117 class ConfigVersionMismatch(ConfigurationError):
118   """Version mismatch in the configuration file.
119
120   The error has two arguments: the expected and the actual found
121   version.
122
123   """
124
125
126 class ReservationError(GenericError):
127   """Errors reserving a resource.
128
129   """
130
131
132 class RemoteError(GenericError):
133   """Programming-related error on remote call.
134
135   This is raised when an unhandled error occurs in a call to a
136   remote node.  It usually signifies a real programming bug.
137
138   """
139
140
141 class SignatureError(GenericError):
142   """Error authenticating a remote message.
143
144   This is raised when the hmac signature on a message doesn't verify correctly
145   to the message itself. It can happen because of network unreliability or
146   because of spurious traffic.
147
148   """
149
150
151 class ParameterError(GenericError):
152   """A passed parameter to a command is invalid.
153
154   This is raised when the parameter passed to a request function is
155   invalid. Correct code should have verified this before passing the
156   request structure.
157
158   The argument to this exception should be the parameter name.
159
160   """
161
162
163 class ResultValidationError(GenericError):
164   """The iallocation results fails validation.
165
166   """
167
168
169 class OpPrereqError(GenericError):
170   """Prerequisites for the OpCode are not fulfilled.
171
172   This exception has two arguments: an error message, and one of the
173   ECODE_* codes.
174
175   """
176
177
178 class OpExecError(GenericError):
179   """Error during OpCode execution.
180
181   """
182
183
184 class OpResultError(GenericError):
185   """Issue with OpCode result.
186
187   """
188
189
190 class OpCodeUnknown(GenericError):
191   """Unknown opcode submitted.
192
193   This signifies a mismatch between the definitions on the client and
194   server side.
195
196   """
197
198
199 class JobLost(GenericError):
200   """Submitted job lost.
201
202   The job was submitted but it cannot be found in the current job
203   list.
204
205   """
206
207
208 class JobFileCorrupted(GenericError):
209   """Job file could not be properly decoded/restored.
210
211   """
212
213
214 class ResolverError(GenericError):
215   """Host name cannot be resolved.
216
217   This is not a normal situation for Ganeti, as we rely on having a
218   working resolver.
219
220   The non-resolvable hostname is available as the first element of the
221   args tuple; the other two elements of the tuple are the first two
222   args of the socket.gaierror exception (error code and description).
223
224   """
225
226
227 class HooksFailure(GenericError):
228   """A generic hook failure.
229
230   This signifies usually a setup misconfiguration.
231
232   """
233
234
235 class HooksAbort(HooksFailure):
236   """A required hook has failed.
237
238   This caused an abort of the operation in the initial phase. This
239   exception always has an attribute args which is a list of tuples of:
240     - node: the source node on which this hooks has failed
241     - script: the name of the script which aborted the run
242
243   """
244
245
246 class UnitParseError(GenericError):
247   """Unable to parse size unit.
248
249   """
250
251
252 class ParseError(GenericError):
253   """Generic parse error.
254
255   Raised when unable to parse user input.
256
257   """
258
259
260 class TypeEnforcementError(GenericError):
261   """Unable to enforce data type.
262
263   """
264
265
266 class X509CertError(GenericError):
267   """Invalid X509 certificate.
268
269   This error has two arguments: the certificate filename and the error cause.
270
271   """
272
273
274 class TagError(GenericError):
275   """Generic tag error.
276
277   The argument to this exception will show the exact error.
278
279   """
280
281
282 class CommandError(GenericError):
283   """External command error.
284
285   """
286
287
288 class StorageError(GenericError):
289   """Storage-related exception.
290
291   """
292
293
294 class InotifyError(GenericError):
295   """Error raised when there is a failure setting up an inotify watcher.
296
297   """
298
299
300 class QuitGanetiException(Exception):
301   """Signal Ganeti that it must quit.
302
303   This is not necessarily an error (and thus not a subclass of
304   GenericError), but it's an exceptional circumstance and it is thus
305   treated. This exception should be instantiated with two values. The
306   first one will specify the return code to the caller, and the second
307   one will be the returned result (either as an error or as a normal
308   result). Usually only the leave cluster rpc call should return
309   status True (as there it's expected we quit), every other call will
310   return status False (as a critical error was encountered).
311
312   Examples::
313
314     # Return a result of "True" to the caller, but quit ganeti afterwards
315     raise QuitGanetiException(True, None)
316     # Send an error to the caller, and quit ganeti
317     raise QuitGanetiException(False, "Fatal safety violation, shutting down")
318
319   """
320
321
322 class JobQueueError(GenericError):
323   """Job queue error.
324
325   """
326
327
328 class JobQueueDrainError(JobQueueError):
329   """Job queue is marked for drain error.
330
331   This is raised when a job submission attempt is made but the queue
332   is marked for drain.
333
334   """
335
336
337 class JobQueueFull(JobQueueError):
338   """Job queue full error.
339
340   Raised when job queue size reached its hard limit.
341
342   """
343
344
345 class ConfdMagicError(GenericError):
346   """A magic fourcc error in Ganeti confd.
347
348   Errors processing the fourcc in ganeti confd datagrams.
349
350   """
351
352
353 class ConfdClientError(GenericError):
354   """A magic fourcc error in Ganeti confd.
355
356   Errors in the confd client library.
357
358   """
359
360
361 class UdpDataSizeError(GenericError):
362   """UDP payload too big.
363
364   """
365
366
367 class NoCtypesError(GenericError):
368   """python ctypes module is not found in the system.
369
370   """
371
372
373 class IPAddressError(GenericError):
374   """Generic IP address error.
375
376   """
377
378
379 class LuxiError(GenericError):
380   """LUXI error.
381
382   """
383
384
385 class QueryFilterParseError(ParseError):
386   """Error while parsing query filter.
387
388   This exception must be instantiated with two values. The first one is a
389   string with an error description, the second one is an instance of a subclass
390   of C{pyparsing.ParseBaseException} (used to display the exact error
391   location).
392
393   """
394   def GetDetails(self):
395     """Returns a list of strings with details about the error.
396
397     """
398     try:
399       (_, inner) = self.args
400     except IndexError:
401       return None
402
403     return [str(inner.line),
404             (" " * (inner.column - 1)) + "^",
405             str(inner)]
406
407
408 class RapiTestResult(GenericError):
409   """Exception containing results from RAPI test utilities.
410
411   """
412
413
414 class FileStoragePathError(GenericError):
415   """Error from file storage path validation.
416
417   """
418
419
420 # errors should be added above
421
422
423 def GetErrorClass(name):
424   """Return the class of an exception.
425
426   Given the class name, return the class itself.
427
428   @type name: str
429   @param name: the exception name
430   @rtype: class
431   @return: the actual class, or None if not found
432
433   """
434   item = globals().get(name, None)
435   if item is not None:
436     if not (isinstance(item, type(Exception)) and
437             issubclass(item, GenericError)):
438       item = None
439   return item
440
441
442 def EncodeException(err):
443   """Encodes an exception into a format that L{MaybeRaise} will recognise.
444
445   The passed L{err} argument will be formatted as a tuple (exception
446   name, arguments) that the MaybeRaise function will recognise.
447
448   @type err: GenericError child
449   @param err: usually a child of GenericError (but any exception
450       will be accepted)
451   @rtype: tuple
452   @return: tuple of (exception name, exception arguments)
453
454   """
455   return (err.__class__.__name__, err.args)
456
457
458 def GetEncodedError(result):
459   """If this looks like an encoded Ganeti exception, return it.
460
461   This function tries to parse the passed argument and if it looks
462   like an encoding done by EncodeException, it will return the class
463   object and arguments.
464
465   """
466   tlt = (tuple, list)
467   if (isinstance(result, tlt) and len(result) == 2 and
468       isinstance(result[1], tlt)):
469     # custom ganeti errors
470     errcls = GetErrorClass(result[0])
471     if errcls:
472       return (errcls, tuple(result[1]))
473
474   return None
475
476
477 def MaybeRaise(result):
478   """If this looks like an encoded Ganeti exception, raise it.
479
480   This function tries to parse the passed argument and if it looks
481   like an encoding done by EncodeException, it will re-raise it.
482
483   """
484   error = GetEncodedError(result)
485   if error:
486     (errcls, args) = error
487     # pylint: disable=W0142
488     raise errcls(*args)