Bump version for Ganeti 2.3
[ganeti-local] / NEWS
1 News
2 ====
3
4 Version 2.3 rc0
5 ---------------
6
7 *(Released Tue, 2 Nov 2010)*
8
9 - Fixed clearing of the default iallocator using ``gnt-cluster modify``
10 - Fixed master failover race with watcher
11 - Fixed a bug in ``gnt-node modify`` which could lead to an inconsistent
12   configuration
13 - Accept previously stopped instance for export with instance removal
14 - Simplify and extend the environment variables for instance OS scripts
15 - Added new node flags, ``master_capable`` and ``vm_capable``
16 - Added optional instance disk wiping prior during allocation. This is a
17   cluster-wide option and can be set/modified using
18   ``gnt-cluster {init,modify} --prealloc-wipe-disks``.
19 - Added IPv6 support, see :doc:`design document <design-2.3>` and
20   :doc:`install-quick`
21 - Added a new watcher option (``--ignore-pause``)
22 - Added option to ignore offline node on instance start/stop
23   (``--ignore-offline``)
24 - Allow overriding OS parameters with ``gnt-instance reinstall``
25 - Added ability to change node's secondary IP address using ``gnt-node
26   modify``
27 - Implemented privilege separation for all daemons except
28   ``ganeti-noded``, see ``configure`` options
29 - Complain if an instance's disk is marked faulty in ``gnt-cluster
30   verify``
31 - Implemented job priorities (see ``ganeti(7)`` manpage)
32 - Ignore failures while shutting down instances during failover from
33   offline node
34 - Exit daemon's bootstrap process only once daemon is ready
35 - Export more information via ``LUQueryInstances``/remote API
36 - Improved documentation, QA and unittests
37 - RAPI daemon now watches ``rapi_users`` all the time and doesn't need a
38   restart if the file was created or changed
39 - Added LUXI protocol version sent with each request and response,
40   allowing detection of server/client mismatches
41 - Moved the Python scripts among gnt-* and ganeti-* modules
42 - Moved all code related to setting up SSH to an external script,
43   ``setup-ssh``
44 - Infrastructure changes for node group support in future versions
45
46
47 Version 2.2.1
48 -------------
49
50 *(Released Tue, 19 Oct 2010)*
51
52 - Disable SSL session ID cache in RPC client
53
54
55 Version 2.2.1 rc1
56 -----------------
57
58 *(Released Thu, 14 Oct 2010)*
59
60 - Fix interaction between Curl/GnuTLS and the Python's HTTP server
61   (thanks Apollon Oikonomopoulos!), finally allowing the use of Curl
62   with GnuTLS
63 - Fix problems with interaction between Curl and Python's HTTP server,
64   resulting in increased speed in many RPC calls
65 - Improve our release script to prevent breakage with older aclocal and
66   Python 2.6
67
68
69 Version 2.2.1 rc0
70 -----------------
71
72 *(Released Thu, 7 Oct 2010)*
73
74 - Fixed issue 125, replace hardcoded “xenvg” in ``gnt-cluster`` with
75   value retrieved from master
76 - Added support for blacklisted or hidden OS definitions
77 - Added simple lock monitor (accessible via (``gnt-debug locks``)
78 - Added support for -mem-path in KVM hypervisor abstraction layer
79 - Allow overriding instance parameters in tool for inter-cluster
80   instance moves (``tools/move-instance``)
81 - Improved opcode summaries (e.g. in ``gnt-job list``)
82 - Improve consistency of OS listing by sorting it
83 - Documentation updates
84
85
86 Version 2.2.0.1
87 ---------------
88
89 *(Released Fri, 8 Oct 2010)*
90
91 - Rebuild with a newer autotools version, to fix python 2.6 compatibility
92
93
94 Version 2.2.0
95 -------------
96
97 *(Released Mon, 4 Oct 2010)*
98
99 - Fixed regression in ``gnt-instance rename``
100
101
102 Version 2.2.0 rc2
103 -----------------
104
105 *(Released Wed, 22 Sep 2010)*
106
107 - Fixed OS_VARIANT variable for OS scripts
108 - Fixed cluster tag operations via RAPI
109 - Made ``setup-ssh`` exit with non-zero code if an error occurred
110 - Disabled RAPI CA checks in watcher
111
112
113 Version 2.2.0 rc1
114 -----------------
115
116 *(Released Mon, 23 Aug 2010)*
117
118 - Support DRBD versions of the format "a.b.c.d"
119 - Updated manpages
120 - Re-introduce support for usage from multiple threads in RAPI client
121 - Instance renames and modify via RAPI
122 - Work around race condition between processing and archival in job
123   queue
124 - Mark opcodes following failed one as failed, too
125 - Job field ``lock_status`` was removed due to difficulties making it
126   work with the changed job queue in Ganeti 2.2; a better way to monitor
127   locks is expected for a later 2.2.x release
128 - Fixed dry-run behaviour with many commands
129 - Support ``ssh-agent`` again when adding nodes
130 - Many additional bugfixes
131
132
133 Version 2.2.0 rc0
134 -----------------
135
136 *(Released Fri, 30 Jul 2010)*
137
138 Important change: the internal RPC mechanism between Ganeti nodes has
139 changed from using a home-grown http library (based on the Python base
140 libraries) to use the PycURL library. This requires that PycURL is
141 installed on nodes. Please note that on Debian/Ubuntu, PycURL is linked
142 against GnuTLS by default. cURL's support for GnuTLS had known issues
143 before cURL 7.21.0 and we recommend using the latest cURL release or
144 linking against OpenSSL. Most other distributions already link PycURL
145 and cURL against OpenSSL. The command::
146
147   python -c 'import pycurl; print pycurl.version'
148
149 can be used to determine the libraries PycURL and cURL are linked
150 against.
151
152 Other significant changes:
153
154 - Rewrote much of the internals of the job queue, in order to achieve
155   better parallelism; this decouples job query operations from the job
156   processing, and it should allow much nicer behaviour of the master
157   daemon under load, and it also has uncovered some long-standing bugs
158   related to the job serialisation (now fixed)
159 - Added a default iallocator setting to the cluster parameters,
160   eliminating the need to always pass nodes or an iallocator for
161   operations that require selection of new node(s)
162 - Added experimental support for the LXC virtualization method
163 - Added support for OS parameters, which allows the installation of
164   instances to pass parameter to OS scripts in order to customise the
165   instance
166 - Added a hypervisor parameter controlling the migration type (live or
167   non-live), since hypervisors have various levels of reliability; this
168   has renamed the 'live' parameter to 'mode'
169 - Added a cluster parameter ``reserved_lvs`` that denotes reserved
170   logical volumes, meaning that cluster verify will ignore them and not
171   flag their presence as errors
172 - The watcher will now reset the error count for failed instances after
173   8 hours, thus allowing self-healing if the problem that caused the
174   instances to be down/fail to start has cleared in the meantime
175 - Added a cluster parameter ``drbd_usermode_helper`` that makes Ganeti
176   check for, and warn, if the drbd module parameter ``usermode_helper``
177   is not consistent with the cluster-wide setting; this is needed to
178   make diagnose easier of failed drbd creations
179 - Started adding base IPv6 support, but this is not yet
180   enabled/available for use
181 - Rename operations (cluster, instance) will now return the new name,
182   which is especially useful if a short name was passed in
183 - Added support for instance migration in RAPI
184 - Added a tool to pre-configure nodes for the SSH setup, before joining
185   them to the cluster; this will allow in the future a simplified model
186   for node joining (but not yet fully enabled in 2.2); this needs the
187   paramiko python library
188 - Fixed handling of name-resolving errors
189 - Fixed consistency of job results on the error path
190 - Fixed master-failover race condition when executed multiple times in
191   sequence
192 - Fixed many bugs related to the job queue (mostly introduced during the
193   2.2 development cycle, so not all are impacting 2.1)
194 - Fixed instance migration with missing disk symlinks
195 - Fixed handling of unknown jobs in ``gnt-job archive``
196 - And many other small fixes/improvements
197
198 Internal changes:
199
200 - Enhanced both the unittest and the QA coverage
201 - Switched the opcode validation to a generic model, and extended the
202   validation to all opcode parameters
203 - Changed more parts of the code that write shell scripts to use the
204   same class for this
205 - Switched the master daemon to use the asyncore library for the Luxi
206   server endpoint
207
208
209 Version 2.2.0 beta 0
210 --------------------
211
212 *(Released Thu, 17 Jun 2010)*
213
214 - Added tool (``move-instance``) and infrastructure to move instances
215   between separate clusters (see :doc:`separate documentation
216   <move-instance>` and :doc:`design document <design-2.2>`)
217 - Added per-request RPC timeout
218 - RAPI now requires a Content-Type header for requests with a body (e.g.
219   ``PUT`` or ``POST``) which must be set to ``application/json`` (see
220   :rfc:`2616` (HTTP/1.1), section 7.2.1)
221 - ``ganeti-watcher`` attempts to restart ``ganeti-rapi`` if RAPI is not
222   reachable
223 - Implemented initial support for running Ganeti daemons as separate
224   users, see configure-time flags ``--with-user-prefix`` and
225   ``--with-group-prefix`` (only ``ganeti-rapi`` is supported at this
226   time)
227 - Instances can be removed after export (``gnt-backup export
228   --remove-instance``)
229 - Self-signed certificates generated by Ganeti now use a 2048 bit RSA
230   key (instead of 1024 bit)
231 - Added new cluster configuration file for cluster domain secret
232 - Import/export now use SSL instead of SSH
233 - Added support for showing estimated time when exporting an instance,
234   see the ``ganeti-os-interface(7)`` manpage and look for
235   ``EXP_SIZE_FD``
236
237 Version 2.1.7
238 -------------
239
240 *(Released Tue, 24 Aug 2010)*
241
242 Bugfixes only:
243   - Don't ignore secondary node silently on non-mirrored disk templates
244     (issue 113)
245   - Fix --master-netdev arg name in gnt-cluster(8) (issue 114)
246   - Fix usb_mouse parameter breaking with vnc_console (issue 109)
247   - Properly document the usb_mouse parameter
248   - Fix path in ganeti-rapi(8) (issue 116)
249   - Adjust error message when the ganeti user's .ssh directory is
250     missing
251   - Add same-node-check when changing the disk template to drbd
252
253
254 Version 2.1.6
255 -------------
256
257 *(Released Fri, 16 Jul 2010)*
258
259 Bugfixes only:
260   - Add an option to only select some reboot types during qa/burnin.
261     (on some hypervisors consequent reboots are not supported)
262   - Fix infrequent race condition in master failover. Sometimes the old
263     master ip address would be still detected as up for a short time
264     after it was removed, causing failover to fail.
265   - Decrease mlockall warnings when the ctypes module is missing. On
266     Python 2.4 we support running even if no ctypes module is installed,
267     but we were too verbose about this issue.
268   - Fix building on old distributions, on which man doesn't have a
269     --warnings option.
270   - Fix RAPI not to ignore the MAC address on instance creation
271   - Implement the old instance creation format in the RAPI client.
272
273
274 Version 2.1.5
275 -------------
276
277 *(Released Thu, 01 Jul 2010)*
278
279 A small bugfix release:
280   - Fix disk adoption: broken by strict --disk option checking in 2.1.4
281   - Fix batch-create: broken in the whole 2.1 series due to a lookup on
282     a non-existing option
283   - Fix instance create: the --force-variant option was ignored
284   - Improve pylint 0.21 compatibility and warnings with Python 2.6
285   - Fix modify node storage with non-FQDN arguments
286   - Fix RAPI client to authenticate under Python 2.6 when used
287     for more than 5 requests needing authentication
288   - Fix gnt-instance modify -t (storage) giving a wrong error message
289     when converting a non-shutdown drbd instance to plain
290
291
292 Version 2.1.4
293 -------------
294
295 *(Released Fri, 18 Jun 2010)*
296
297 A small bugfix release:
298
299   - Fix live migration of KVM instances started with older Ganeti
300     versions which had fewer hypervisor parameters
301   - Fix gnt-instance grow-disk on down instances
302   - Fix an error-reporting bug during instance migration
303   - Better checking of the ``--net`` and ``--disk`` values, to avoid
304     silently ignoring broken ones
305   - Fix an RPC error reporting bug affecting, for example, RAPI client
306     users
307   - Fix bug triggered by different API version os-es on different nodes
308   - Fix a bug in instance startup with custom hvparams: OS level
309     parameters would fail to be applied.
310   - Fix the RAPI client under Python 2.6 (but more work is needed to
311     make it work completely well with OpenSSL)
312   - Fix handling of errors when resolving names from DNS
313
314
315 Version 2.1.3
316 -------------
317
318 *(Released Thu, 3 Jun 2010)*
319
320 A medium sized development cycle. Some new features, and some
321 fixes/small improvements/cleanups.
322
323 Significant features
324 ~~~~~~~~~~~~~~~~~~~~
325
326 The node deamon now tries to mlock itself into memory, unless the
327 ``--no-mlock`` flag is passed. It also doesn't fail if it can't write
328 its logs, and falls back to console logging. This allows emergency
329 features such as ``gnt-node powercycle`` to work even in the event of a
330 broken node disk (tested offlining the disk hosting the node's
331 filesystem and dropping its memory caches; don't try this at home)
332
333 KVM: add vhost-net acceleration support. It can be tested with a new
334 enough version of the kernel and of qemu-kvm.
335
336 KVM: Add instance chrooting feature. If you use privilege dropping for
337 your VMs you can also now force them to chroot to an empty directory,
338 before starting the emulated guest.
339
340 KVM: Add maximum migration bandwith and maximum downtime tweaking
341 support (requires a new-enough version of qemu-kvm).
342
343 Cluster verify will now warn if the master node doesn't have the master
344 ip configured on it.
345
346 Add a new (incompatible) instance creation request format to RAPI which
347 supports all parameters (previously only a subset was supported, and it
348 wasn't possible to extend the old format to accomodate all the new
349 features. The old format is still supported, and a client can check for
350 this feature, before using it, by checking for its presence in the
351 ``features`` RAPI resource.
352
353 Now with ancient latin support. Try it passing the ``--roman`` option to
354 ``gnt-instance info``, ``gnt-cluster info`` or ``gnt-node list``
355 (requires the python-roman module to be installed, in order to work).
356
357 Other changes
358 ~~~~~~~~~~~~~
359
360 As usual many internal code refactorings, documentation updates, and
361 such. Among others:
362
363   - Lots of improvements and cleanups to the experimental Remote API
364     (RAPI) client library.
365   - A new unit test suite for the core daemon libraries.
366   - A fix to creating missing directories makes sure the umask is not
367     applied anymore. This enforces the same directory permissions
368     everywhere.
369   - Better handling terminating daemons with ctrl+c (used when running
370     them in debugging mode).
371   - Fix a race condition in live migrating a KVM instance, when stat()
372     on the old proc status file returned EINVAL, which is an unexpected
373     value.
374   - Fixed manpage checking with newer man and utf-8 charachters. But now
375     you need the en_US.UTF-8 locale enabled to build Ganeti from git.
376
377
378 Version 2.1.2.1
379 ---------------
380
381 *(Released Fri, 7 May 2010)*
382
383 Fix a bug which prevented untagged KVM instances from starting.
384
385
386 Version 2.1.2
387 -------------
388
389 *(Released Fri, 7 May 2010)*
390
391 Another release with a long development cycle, during which many
392 different features were added.
393
394 Significant features
395 ~~~~~~~~~~~~~~~~~~~~
396
397 The KVM hypervisor now can run the individual instances as non-root, to
398 reduce the impact of a VM being hijacked due to bugs in the
399 hypervisor. It is possible to run all instances as a single (non-root)
400 user, to manually specify a user for each instance, or to dynamically
401 allocate a user out of a cluster-wide pool to each instance, with the
402 guarantee that no two instances will run under the same user ID on any
403 given node.
404
405 An experimental RAPI client library, that can be used standalone
406 (without the other Ganeti libraries), is provided in the source tree as
407 ``lib/rapi/client.py``. Note this client might change its interface in
408 the future, as we iterate on its capabilities.
409
410 A new command, ``gnt-cluster renew-crypto`` has been added to easily
411 replace the cluster's certificates and crypto keys. This might help in
412 case they have been compromised, or have simply expired.
413
414 A new disk option for instance creation has been added that allows one
415 to "adopt" currently existing logical volumes, with data
416 preservation. This should allow easier migration to Ganeti from
417 unmanaged (or managed via other software) instances.
418
419 Another disk improvement is the possibility to convert between redundant
420 (DRBD) and plain (LVM) disk configuration for an instance. This should
421 allow better scalability (starting with one node and growing the
422 cluster, or shrinking a two-node cluster to one node).
423
424 A new feature that could help with automated node failovers has been
425 implemented: if a node sees itself as offline (by querying the master
426 candidates), it will try to shutdown (hard) all instances and any active
427 DRBD devices. This reduces the risk of duplicate instances if an
428 external script automatically failovers the instances on such nodes. To
429 enable this, the cluster parameter ``maintain_node_health`` should be
430 enabled; in the future this option (per the name) will enable other
431 automatic maintenance features.
432
433 Instance export/import now will reuse the original instance
434 specifications for all parameters; that means exporting an instance,
435 deleting it and the importing it back should give an almost identical
436 instance. Note that the default import behaviour has changed from
437 before, where it created only one NIC; now it recreates the original
438 number of NICs.
439
440 Cluster verify has added a few new checks: SSL certificates validity,
441 /etc/hosts consistency across the cluster, etc.
442
443 Other changes
444 ~~~~~~~~~~~~~
445
446 As usual, many internal changes were done, documentation fixes,
447 etc. Among others:
448
449 - Fixed cluster initialization with disabled cluster storage (regression
450   introduced in 2.1.1)
451 - File-based storage supports growing the disks
452 - Fixed behaviour of node role changes
453 - Fixed cluster verify for some corner cases, plus a general rewrite of
454   cluster verify to allow future extension with more checks
455 - Fixed log spamming by watcher and node daemon (regression introduced
456   in 2.1.1)
457 - Fixed possible validation issues when changing the list of enabled
458   hypervisors
459 - Fixed cleanup of /etc/hosts during node removal
460 - Fixed RAPI response for invalid methods
461 - Fixed bug with hashed passwords in ``ganeti-rapi`` daemon
462 - Multiple small improvements to the KVM hypervisor (VNC usage, booting
463   from ide disks, etc.)
464 - Allow OS changes without re-installation (to record a changed OS
465   outside of Ganeti, or to allow OS renames)
466 - Allow instance creation without OS installation (useful for example if
467   the OS will be installed manually, or restored from a backup not in
468   Ganeti format)
469 - Implemented option to make cluster ``copyfile`` use the replication
470   network
471 - Added list of enabled hypervisors to ssconf (possibly useful for
472   external scripts)
473 - Added a new tool (``tools/cfgupgrade12``) that allows upgrading from
474   1.2 clusters
475 - A partial form of node re-IP is possible via node readd, which now
476   allows changed node primary IP
477 - Command line utilities now show an informational message if the job is
478   waiting for a lock
479 - The logs of the master daemon now show the PID/UID/GID of the
480   connected client
481
482
483 Version 2.1.1
484 -------------
485
486 *(Released Fri, 12 Mar 2010)*
487
488 During the 2.1.0 long release candidate cycle, a lot of improvements and
489 changes have accumulated with were released later as 2.1.1.
490
491 Major changes
492 ~~~~~~~~~~~~~
493
494 The node evacuate command (``gnt-node evacuate``) was significantly
495 rewritten, and as such the IAllocator protocol was changed - a new
496 request type has been added. This unfortunate change during a stable
497 series is designed to improve performance of node evacuations; on
498 clusters with more than about five nodes and which are well-balanced,
499 evacuation should proceed in parallel for all instances of the node
500 being evacuated. As such, any existing IAllocator scripts need to be
501 updated, otherwise the above command will fail due to the unknown
502 request. The provided "dumb" allocator has not been updated; but the
503 ganeti-htools package supports the new protocol since version 0.2.4.
504
505 Another important change is increased validation of node and instance
506 names. This might create problems in special cases, if invalid host
507 names are being used.
508
509 Also, a new layer of hypervisor parameters has been added, that sits at
510 OS level between the cluster defaults and the instance ones. This allows
511 customisation of virtualization parameters depending on the installed
512 OS. For example instances with OS 'X' may have a different KVM kernel
513 (or any other parameter) than the cluster defaults. This is intended to
514 help managing a multiple OSes on the same cluster, without manual
515 modification of each instance's parameters.
516
517 A tool for merging clusters, ``cluster-merge``, has been added in the
518 tools sub-directory.
519
520 Bug fixes
521 ~~~~~~~~~
522
523 - Improved the int/float conversions that should make the code more
524   robust in face of errors from the node daemons
525 - Fixed the remove node code in case of internal configuration errors
526 - Fixed the node daemon behaviour in face of inconsistent queue
527   directory (e.g. read-only file-system where we can't open the files
528   read-write, etc.)
529 - Fixed the behaviour of gnt-node modify for master candidate demotion;
530   now it either aborts cleanly or, if given the new “auto_promote”
531   parameter, will automatically promote other nodes as needed
532 - Fixed compatibility with (unreleased yet) Python 2.6.5 that would
533   completely prevent Ganeti from working
534 - Fixed bug for instance export when not all disks were successfully
535   exported
536 - Fixed behaviour of node add when the new node is slow in starting up
537   the node daemon
538 - Fixed handling of signals in the LUXI client, which should improve
539   behaviour of command-line scripts
540 - Added checks for invalid node/instance names in the configuration (now
541   flagged during cluster verify)
542 - Fixed watcher behaviour for disk activation errors
543 - Fixed two potentially endless loops in http library, which led to the
544   RAPI daemon hanging and consuming 100% CPU in some cases
545 - Fixed bug in RAPI daemon related to hashed passwords
546 - Fixed bug for unintended qemu-level bridging of multi-NIC KVM
547   instances
548 - Enhanced compatibility with non-Debian OSes, but not using absolute
549   path in some commands and allowing customisation of the ssh
550   configuration directory
551 - Fixed possible future issue with new Python versions by abiding to the
552   proper use of ``__slots__`` attribute on classes
553 - Added checks that should prevent directory traversal attacks
554 - Many documentation fixes based on feedback from users
555
556 New features
557 ~~~~~~~~~~~~
558
559 - Added an “early_release” more for instance replace disks and node
560   evacuate, where we release locks earlier and thus allow higher
561   parallelism within the cluster
562 - Added watcher hooks, intended to allow the watcher to restart other
563   daemons (e.g. from the ganeti-nbma project), but they can be used of
564   course for any other purpose
565 - Added a compile-time disable for DRBD barriers, to increase
566   performance if the administrator trusts the power supply or the
567   storage system to not lose writes
568 - Added the option of using syslog for logging instead of, or in
569   addition to, Ganeti's own log files
570 - Removed boot restriction for paravirtual NICs for KVM, recent versions
571   can indeed boot from a paravirtual NIC
572 - Added a generic debug level for many operations; while this is not
573   used widely yet, it allows one to pass the debug value all the way to
574   the OS scripts
575 - Enhanced the hooks environment for instance moves (failovers,
576   migrations) where the primary/secondary nodes changed during the
577   operation, by adding {NEW,OLD}_{PRIMARY,SECONDARY} vars
578 - Enhanced data validations for many user-supplied values; one important
579   item is the restrictions imposed on instance and node names, which
580   might reject some (invalid) host names
581 - Add a configure-time option to disable file-based storage, if it's not
582   needed; this allows greater security separation between the master
583   node and the other nodes from the point of view of the inter-node RPC
584   protocol
585 - Added user notification in interactive tools if job is waiting in the
586   job queue or trying to acquire locks
587 - Added log messages when a job is waiting for locks
588 - Added filtering by node tags in instance operations which admit
589   multiple instances (start, stop, reboot, reinstall)
590 - Added a new tool for cluster mergers, ``cluster-merge``
591 - Parameters from command line which are of the form ``a=b,c=d`` can now
592   use backslash escapes to pass in values which contain commas,
593   e.g. ``a=b\\c,d=e`` where the 'a' parameter would get the value
594   ``b,c``
595 - For KVM, the instance name is the first parameter passed to KVM, so
596   that it's more visible in the process list
597
598
599 Version 2.1.0
600 -------------
601
602 *(Released Tue, 2 Mar 2010)*
603
604 Ganeti 2.1 brings many improvements with it. Major changes:
605
606 - Added infrastructure to ease automated disk repairs
607 - Added new daemon to export configuration data in a cheaper way than
608   using the remote API
609 - Instance NICs can now be routed instead of being associated with a
610   networking bridge
611 - Improved job locking logic to reduce impact of jobs acquiring multiple
612   locks waiting for other long-running jobs
613
614 In-depth implementation details can be found in the Ganeti 2.1 design
615 document.
616
617 Details
618 ~~~~~~~
619
620 - Added chroot hypervisor
621 - Added more options to xen-hvm hypervisor (``kernel_path`` and
622   ``device_model``)
623 - Added more options to xen-pvm hypervisor (``use_bootloader``,
624   ``bootloader_path`` and ``bootloader_args``)
625 - Added the ``use_localtime`` option for the xen-hvm and kvm
626   hypervisors, and the default value for this has changed to false (in
627   2.0 xen-hvm always enabled it)
628 - Added luxi call to submit multiple jobs in one go
629 - Added cluster initialization option to not modify ``/etc/hosts``
630   file on nodes
631 - Added network interface parameters
632 - Added dry run mode to some LUs
633 - Added RAPI resources:
634
635   - ``/2/instances/[instance_name]/info``
636   - ``/2/instances/[instance_name]/replace-disks``
637   - ``/2/nodes/[node_name]/evacuate``
638   - ``/2/nodes/[node_name]/migrate``
639   - ``/2/nodes/[node_name]/role``
640   - ``/2/nodes/[node_name]/storage``
641   - ``/2/nodes/[node_name]/storage/modify``
642   - ``/2/nodes/[node_name]/storage/repair``
643
644 - Added OpCodes to evacuate or migrate all instances on a node
645 - Added new command to list storage elements on nodes (``gnt-node
646   list-storage``) and modify them (``gnt-node modify-storage``)
647 - Added new ssconf files with master candidate IP address
648   (``ssconf_master_candidates_ips``), node primary IP address
649   (``ssconf_node_primary_ips``) and node secondary IP address
650   (``ssconf_node_secondary_ips``)
651 - Added ``ganeti-confd`` and a client library to query the Ganeti
652   configuration via UDP
653 - Added ability to run hooks after cluster initialization and before
654   cluster destruction
655 - Added automatic mode for disk replace (``gnt-instance replace-disks
656   --auto``)
657 - Added ``gnt-instance recreate-disks`` to re-create (empty) disks
658   after catastrophic data-loss
659 - Added ``gnt-node repair-storage`` command to repair damaged LVM volume
660   groups
661 - Added ``gnt-instance move`` command to move instances
662 - Added ``gnt-cluster watcher`` command to control watcher
663 - Added ``gnt-node powercycle`` command to powercycle nodes
664 - Added new job status field ``lock_status``
665 - Added parseable error codes to cluster verification (``gnt-cluster
666   verify --error-codes``) and made output less verbose (use
667   ``--verbose`` to restore previous behaviour)
668 - Added UUIDs to the main config entities (cluster, nodes, instances)
669 - Added support for OS variants
670 - Added support for hashed passwords in the Ganeti remote API users file
671   (``rapi_users``)
672 - Added option to specify maximum timeout on instance shutdown
673 - Added ``--no-ssh-init`` option to ``gnt-cluster init``
674 - Added new helper script to start and stop Ganeti daemons
675   (``daemon-util``), with the intent to reduce the work necessary to
676   adjust Ganeti for non-Debian distributions and to start/stop daemons
677   from one place
678 - Added more unittests
679 - Fixed critical bug in ganeti-masterd startup
680 - Removed the configure-time ``kvm-migration-port`` parameter, this is
681   now customisable at the cluster level for both the KVM and Xen
682   hypervisors using the new ``migration_port`` parameter
683 - Pass ``INSTANCE_REINSTALL`` variable to OS installation script when
684   reinstalling an instance
685 - Allowed ``@`` in tag names
686 - Migrated to Sphinx (http://sphinx.pocoo.org/) for documentation
687 - Many documentation updates
688 - Distribute hypervisor files on ``gnt-cluster redist-conf``
689 - ``gnt-instance reinstall`` can now reinstall multiple instances
690 - Updated many command line parameters
691 - Introduced new OS API version 15
692 - No longer support a default hypervisor
693 - Treat virtual LVs as inexistent
694 - Improved job locking logic to reduce lock contention
695 - Match instance and node names case insensitively
696 - Reimplemented bash completion script to be more complete
697 - Improved burnin
698
699
700 Version 2.0.6
701 -------------
702
703 *(Released Thu, 4 Feb 2010)*
704
705 - Fix cleaner behaviour on nodes not in a cluster (Debian bug 568105)
706 - Fix a string formatting bug
707 - Improve safety of the code in some error paths
708 - Improve data validation in the master of values returned from nodes
709
710
711 Version 2.0.5
712 -------------
713
714 *(Released Thu, 17 Dec 2009)*
715
716 - Fix security issue due to missing validation of iallocator names; this
717   allows local and remote execution of arbitrary executables
718 - Fix failure of gnt-node list during instance removal
719 - Ship the RAPI documentation in the archive
720
721
722 Version 2.0.4
723 -------------
724
725 *(Released Wed, 30 Sep 2009)*
726
727 - Fixed many wrong messages
728 - Fixed a few bugs related to the locking library
729 - Fixed MAC checking at instance creation time
730 - Fixed a DRBD parsing bug related to gaps in /proc/drbd
731 - Fixed a few issues related to signal handling in both daemons and
732   scripts
733 - Fixed the example startup script provided
734 - Fixed insserv dependencies in the example startup script (patch from
735   Debian)
736 - Fixed handling of drained nodes in the iallocator framework
737 - Fixed handling of KERNEL_PATH parameter for xen-hvm (Debian bug
738   #528618)
739 - Fixed error related to invalid job IDs in job polling
740 - Fixed job/opcode persistence on unclean master shutdown
741 - Fixed handling of partial job processing after unclean master
742   shutdown
743 - Fixed error reporting from LUs, previously all errors were converted
744   into execution errors
745 - Fixed error reporting from burnin
746 - Decreased significantly the memory usage of the job queue
747 - Optimised slightly multi-job submission
748 - Optimised slightly opcode loading
749 - Backported the multi-job submit framework from the development
750   branch; multi-instance start and stop should be faster
751 - Added script to clean archived jobs after 21 days; this will reduce
752   the size of the queue directory
753 - Added some extra checks in disk size tracking
754 - Added an example ethers hook script
755 - Added a cluster parameter that prevents Ganeti from modifying of
756   /etc/hosts
757 - Added more node information to RAPI responses
758 - Added a ``gnt-job watch`` command that allows following the ouput of a
759   job
760 - Added a bind-address option to ganeti-rapi
761 - Added more checks to the configuration verify
762 - Enhanced the burnin script such that some operations can be retried
763   automatically
764 - Converted instance reinstall to multi-instance model
765
766
767 Version 2.0.3
768 -------------
769
770 *(Released Fri, 7 Aug 2009)*
771
772 - Added ``--ignore-size`` to the ``gnt-instance activate-disks`` command
773   to allow using the pre-2.0.2 behaviour in activation, if any existing
774   instances have mismatched disk sizes in the configuration
775 - Added ``gnt-cluster repair-disk-sizes`` command to check and update
776   any configuration mismatches for disk sizes
777 - Added ``gnt-master cluste-failover --no-voting`` to allow master
778   failover to work on two-node clusters
779 - Fixed the ``--net`` option of ``gnt-backup import``, which was
780   unusable
781 - Fixed detection of OS script errors in ``gnt-backup export``
782 - Fixed exit code of ``gnt-backup export``
783
784
785 Version 2.0.2
786 -------------
787
788 *(Released Fri, 17 Jul 2009)*
789
790 - Added experimental support for stripped logical volumes; this should
791   enhance performance but comes with a higher complexity in the block
792   device handling; stripping is only enabled when passing
793   ``--with-lvm-stripecount=N`` to ``configure``, but codepaths are
794   affected even in the non-stripped mode
795 - Improved resiliency against transient failures at the end of DRBD
796   resyncs, and in general of DRBD resync checks
797 - Fixed a couple of issues with exports and snapshot errors
798 - Fixed a couple of issues in instance listing
799 - Added display of the disk size in ``gnt-instance info``
800 - Fixed checking for valid OSes in instance creation
801 - Fixed handling of the "vcpus" parameter in instance listing and in
802   general of invalid parameters
803 - Fixed http server library, and thus RAPI, to handle invalid
804   username/password combinations correctly; this means that now they
805   report unauthorized for queries too, not only for modifications,
806   allowing earlier detect of configuration problems
807 - Added a new "role" node list field, equivalent to the master/master
808   candidate/drained/offline flags combinations
809 - Fixed cluster modify and changes of candidate pool size
810 - Fixed cluster verify error messages for wrong files on regular nodes
811 - Fixed a couple of issues with node demotion from master candidate role
812 - Fixed node readd issues
813 - Added non-interactive mode for ``ganeti-masterd --no-voting`` startup
814 - Added a new ``--no-voting`` option for masterfailover to fix failover
815   on two-nodes clusters when the former master node is unreachable
816 - Added instance reinstall over RAPI
817
818
819 Version 2.0.1
820 -------------
821
822 *(Released Tue, 16 Jun 2009)*
823
824 - added ``-H``/``-B`` startup parameters to ``gnt-instance``, which will
825   allow re-adding the start in single-user option (regression from 1.2)
826 - the watcher writes the instance status to a file, to allow monitoring
827   to report the instance status (from the master) based on cached
828   results of the watcher's queries; while this can get stale if the
829   watcher is being locked due to other work on the cluster, this is
830   still an improvement
831 - the watcher now also restarts the node daemon and the rapi daemon if
832   they died
833 - fixed the watcher to handle full and drained queue cases
834 - hooks export more instance data in the environment, which helps if
835   hook scripts need to take action based on the instance's properties
836   (no longer need to query back into ganeti)
837 - instance failovers when the instance is stopped do not check for free
838   RAM, so that failing over a stopped instance is possible in low memory
839   situations
840 - rapi uses queries for tags instead of jobs (for less job traffic), and
841   for cluster tags it won't talk to masterd at all but read them from
842   ssconf
843 - a couple of error handling fixes in RAPI
844 - drbd handling: improved the error handling of inconsistent disks after
845   resync to reduce the frequency of "there are some degraded disks for
846   this instance" messages
847 - fixed a bug in live migration when DRBD doesn't want to reconnect (the
848   error handling path called a wrong function name)
849
850
851 Version 2.0.0 final
852 -------------------
853
854 *(Released Wed, 27 May 2009)*
855
856 - no changes from rc5
857
858
859 Version 2.0 release candidate 5
860 -------------------------------
861
862 *(Released Wed, 20 May 2009)*
863
864 - fix a couple of bugs (validation, argument checks)
865 - fix ``gnt-cluster getmaster`` on non-master nodes (regression)
866 - some small improvements to RAPI and IAllocator
867 - make watcher automatically start the master daemon if down
868
869
870 Version 2.0 release candidate 4
871 -------------------------------
872
873 *(Released Mon, 27 Apr 2009)*
874
875 - change the OS list to not require locks; this helps with big clusters
876 - fix ``gnt-cluster verify`` and ``gnt-cluster verify-disks`` when the
877   volume group is broken
878 - ``gnt-instance info``, without any arguments, doesn't run for all
879   instances anymore; either pass ``--all`` or pass the desired
880   instances; this helps against mistakes on big clusters where listing
881   the information for all instances takes a long time
882 - miscellaneous doc and man pages fixes
883
884
885 Version 2.0 release candidate 3
886 -------------------------------
887
888 *(Released Wed, 8 Apr 2009)*
889
890 - Change the internal locking model of some ``gnt-node`` commands, in
891   order to reduce contention (and blocking of master daemon) when
892   batching many creation/reinstall jobs
893 - Fixes to Xen soft reboot
894 - No longer build documentation at build time, instead distribute it in
895   the archive, in order to reduce the need for the whole docbook/rst
896   toolchains
897
898
899 Version 2.0 release candidate 2
900 -------------------------------
901
902 *(Released Fri, 27 Mar 2009)*
903
904 - Now the cfgupgrade scripts works and can upgrade 1.2.7 clusters to 2.0
905 - Fix watcher startup sequence, improves the behaviour of busy clusters
906 - Some other fixes in ``gnt-cluster verify``, ``gnt-instance
907   replace-disks``, ``gnt-instance add``, ``gnt-cluster queue``, KVM VNC
908   bind address and other places
909 - Some documentation fixes and updates
910
911
912 Version 2.0 release candidate 1
913 -------------------------------
914
915 *(Released Mon, 2 Mar 2009)*
916
917 - More documentation updates, now all docs should be more-or-less
918   up-to-date
919 - A couple of small fixes (mixed hypervisor clusters, offline nodes,
920   etc.)
921 - Added a customizable HV_KERNEL_ARGS hypervisor parameter (for Xen PVM
922   and KVM)
923 - Fix an issue related to $libdir/run/ganeti and cluster creation
924
925
926 Version 2.0 beta 2
927 ------------------
928
929 *(Released Thu, 19 Feb 2009)*
930
931 - Xen PVM and KVM have switched the default value for the instance root
932   disk to the first partition on the first drive, instead of the whole
933   drive; this means that the OS installation scripts must be changed
934   accordingly
935 - Man pages have been updated
936 - RAPI has been switched by default to HTTPS, and the exported functions
937   should all work correctly
938 - RAPI v1 has been removed
939 - Many improvements to the KVM hypervisor
940 - Block device errors are now better reported
941 - Many other bugfixes and small improvements
942
943
944 Version 2.0 beta 1
945 ------------------
946
947 *(Released Mon, 26 Jan 2009)*
948
949 - Version 2 is a general rewrite of the code and therefore the
950   differences are too many to list, see the design document for 2.0 in
951   the ``doc/`` subdirectory for more details
952 - In this beta version there is not yet a migration path from 1.2 (there
953   will be one in the final 2.0 release)
954 - A few significant changes are:
955
956   - all commands are executed by a daemon (``ganeti-masterd``) and the
957     various ``gnt-*`` commands are just front-ends to it
958   - all the commands are entered into, and executed from a job queue,
959     see the ``gnt-job(8)`` manpage
960   - the RAPI daemon supports read-write operations, secured by basic
961     HTTP authentication on top of HTTPS
962   - DRBD version 0.7 support has been removed, DRBD 8 is the only
963     supported version (when migrating from Ganeti 1.2 to 2.0, you need
964     to migrate to DRBD 8 first while still running Ganeti 1.2)
965   - DRBD devices are using statically allocated minor numbers, which
966     will be assigned to existing instances during the migration process
967   - there is support for both Xen PVM and Xen HVM instances running on
968     the same cluster
969   - KVM virtualization is supported too
970   - file-based storage has been implemented, which means that it is
971     possible to run the cluster without LVM and DRBD storage, for
972     example using a shared filesystem exported from shared storage (and
973     still have live migration)
974
975
976 Version 1.2.7
977 -------------
978
979 *(Released Tue, 13 Jan 2009)*
980
981 - Change the default reboot type in ``gnt-instance reboot`` to "hard"
982 - Reuse the old instance mac address by default on instance import, if
983   the instance name is the same.
984 - Handle situations in which the node info rpc returns incomplete
985   results (issue 46)
986 - Add checks for tcp/udp ports collisions in ``gnt-cluster verify``
987 - Improved version of batcher:
988
989   - state file support
990   - instance mac address support
991   - support for HVM clusters/instances
992
993 - Add an option to show the number of cpu sockets and nodes in
994   ``gnt-node list``
995 - Support OSes that handle more than one version of the OS api (but do
996   not change the current API in any other way)
997 - Fix ``gnt-node migrate``
998 - ``gnt-debug`` man page
999 - Fixes various more typos and small issues
1000 - Increase disk resync maximum speed to 60MB/s (from 30MB/s)
1001
1002
1003 Version 1.2.6
1004 -------------
1005
1006 *(Released Wed, 24 Sep 2008)*
1007
1008 - new ``--hvm-nic-type`` and ``--hvm-disk-type`` flags to control the
1009   type of disk exported to fully virtualized instances.
1010 - provide access to the serial console of HVM instances
1011 - instance auto_balance flag, set by default. If turned off it will
1012   avoid warnings on cluster verify if there is not enough memory to fail
1013   over an instance. in the future it will prevent automatically failing
1014   it over when we will support that.
1015 - batcher tool for instance creation, see ``tools/README.batcher``
1016 - ``gnt-instance reinstall --select-os`` to interactively select a new
1017   operating system when reinstalling an instance.
1018 - when changing the memory amount on instance modify a check has been
1019   added that the instance will be able to start. also warnings are
1020   emitted if the instance will not be able to fail over, if auto_balance
1021   is true.
1022 - documentation fixes
1023 - sync fields between ``gnt-instance list/modify/add/import``
1024 - fix a race condition in drbd when the sync speed was set after giving
1025   the device a remote peer.
1026
1027
1028 Version 1.2.5
1029 -------------
1030
1031 *(Released Tue, 22 Jul 2008)*
1032
1033 - note: the allowed size and number of tags per object were reduced
1034 - fix a bug in ``gnt-cluster verify`` with inconsistent volume groups
1035 - fixed twisted 8.x compatibility
1036 - fixed ``gnt-instance replace-disks`` with iallocator
1037 - add TCP keepalives on twisted connections to detect restarted nodes
1038 - disk increase support, see ``gnt-instance grow-disk``
1039 - implement bulk node/instance query for RAPI
1040 - add tags in node/instance listing (optional)
1041 - experimental migration (and live migration) support, read the man page
1042   for ``gnt-instance migrate``
1043 - the ``ganeti-watcher`` logs are now timestamped, and the watcher also
1044   has some small improvements in handling its state file
1045
1046
1047 Version 1.2.4
1048 -------------
1049
1050 *(Released Fri, 13 Jun 2008)*
1051
1052 - Experimental readonly, REST-based remote API implementation;
1053   automatically started on master node, TCP port 5080, if enabled by
1054   ``--enable-rapi`` parameter to configure script.
1055 - Instance allocator support. Add and import instance accept a
1056   ``--iallocator`` parameter, and call that instance allocator to decide
1057   which node to use for the instance. The iallocator document describes
1058   what's expected from an allocator script.
1059 - ``gnt-cluster verify`` N+1 memory redundancy checks: Unless passed the
1060   ``--no-nplus1-mem`` option ``gnt-cluster verify`` now checks that if a
1061   node is lost there is still enough memory to fail over the instances
1062   that reside on it.
1063 - ``gnt-cluster verify`` hooks: it is now possible to add post-hooks to
1064   ``gnt-cluster verify``, to check for site-specific compliance. All the
1065   hooks will run, and their output, if any, will be displayed. Any
1066   failing hook will make the verification return an error value.
1067 - ``gnt-cluster verify`` now checks that its peers are reachable on the
1068   primary and secondary interfaces
1069 - ``gnt-node add`` now supports the ``--readd`` option, to readd a node
1070   that is still declared as part of the cluster and has failed.
1071 - ``gnt-* list`` commands now accept a new ``-o +field`` way of
1072   specifying output fields, that just adds the chosen fields to the
1073   default ones.
1074 - ``gnt-backup`` now has a new ``remove`` command to delete an existing
1075   export from the filesystem.
1076 - New per-instance parameters hvm_acpi, hvm_pae and hvm_cdrom_image_path
1077   have been added. Using them you can enable/disable acpi and pae
1078   support, and specify a path for a cd image to be exported to the
1079   instance. These parameters as the name suggest only work on HVM
1080   clusters.
1081 - When upgrading an HVM cluster to Ganeti 1.2.4, the values for ACPI and
1082   PAE support will be set to the previously hardcoded values, but the
1083   (previously hardcoded) path to the CDROM ISO image will be unset and
1084   if required, needs to be set manually with ``gnt-instance modify``
1085   after the upgrade.
1086 - The address to which an instance's VNC console is bound is now
1087   selectable per-instance, rather than being cluster wide. Of course
1088   this only applies to instances controlled via VNC, so currently just
1089   applies to HVM clusters.
1090
1091
1092 Version 1.2.3
1093 -------------
1094
1095 *(Released Mon, 18 Feb 2008)*
1096
1097 - more tweaks to the disk activation code (especially helpful for DRBD)
1098 - change the default ``gnt-instance list`` output format, now there is
1099   one combined status field (see the manpage for the exact values this
1100   field will have)
1101 - some more fixes for the mac export to hooks change
1102 - make Ganeti not break with DRBD 8.2.x (which changed the version
1103   format in ``/proc/drbd``) (issue 24)
1104 - add an upgrade tool from "remote_raid1" disk template to "drbd" disk
1105   template, allowing migration from DRBD0.7+MD to DRBD8
1106
1107
1108 Version 1.2.2
1109 -------------
1110
1111 *(Released Wed, 30 Jan 2008)*
1112
1113 - fix ``gnt-instance modify`` breakage introduced in 1.2.1 with the HVM
1114   support (issue 23)
1115 - add command aliases infrastructure and a few aliases
1116 - allow listing of VCPUs in the ``gnt-instance list`` and improve the
1117   man pages and the ``--help`` option of ``gnt-node
1118   list``/``gnt-instance list``
1119 - fix ``gnt-backup list`` with down nodes (issue 21)
1120 - change the tools location (move from $pkgdatadir to $pkglibdir/tools)
1121 - fix the dist archive and add a check for including svn/git files in
1122   the future
1123 - some developer-related changes: improve the burnin and the QA suite,
1124   add an upload script for testing during development
1125
1126
1127 Version 1.2.1
1128 -------------
1129
1130 *(Released Wed, 16 Jan 2008)*
1131
1132 - experimental HVM support, read the install document, section
1133   "Initializing the cluster"
1134 - allow for the PVM hypervisor per-instance kernel and initrd paths
1135 - add a new command ``gnt-cluster verify-disks`` which uses a new
1136   algorithm to improve the reconnection of the DRBD pairs if the device
1137   on the secondary node has gone away
1138 - make logical volume code auto-activate LVs at disk activation time
1139 - slightly improve the speed of activating disks
1140 - allow specification of the MAC address at instance creation time, and
1141   changing it later via ``gnt-instance modify``
1142 - fix handling of external commands that generate lots of output on
1143   stderr
1144 - update documentation with regard to minimum version of DRBD8 supported
1145
1146
1147 Version 1.2.0
1148 -------------
1149
1150 *(Released Tue, 4 Dec 2007)*
1151
1152 - Log the ``xm create`` output to the node daemon log on failure (to
1153   help diagnosing the error)
1154 - In debug mode, log all external commands output if failed to the logs
1155 - Change parsing of lvm commands to ignore stderr
1156
1157
1158 Version 1.2b3
1159 -------------
1160
1161 *(Released Wed, 28 Nov 2007)*
1162
1163 - Another round of updates to the DRBD 8 code to deal with more failures
1164   in the replace secondary node operation
1165 - Some more logging of failures in disk operations (lvm, drbd)
1166 - A few documentation updates
1167 - QA updates
1168
1169
1170 Version 1.2b2
1171 -------------
1172
1173 *(Released Tue, 13 Nov 2007)*
1174
1175 - Change configuration file format from Python's Pickle to JSON.
1176   Upgrading is possible using the cfgupgrade utility.
1177 - Add support for DRBD 8.0 (new disk template ``drbd``) which allows for
1178   faster replace disks and is more stable (DRBD 8 has many improvements
1179   compared to DRBD 0.7)
1180 - Added command line tags support (see man pages for ``gnt-instance``,
1181   ``gnt-node``, ``gnt-cluster``)
1182 - Added instance rename support
1183 - Added multi-instance startup/shutdown
1184 - Added cluster rename support
1185 - Added ``gnt-node evacuate`` to simplify some node operations
1186 - Added instance reboot operation that can speedup reboot as compared to
1187   stop and start
1188 - Soften the requirement that hostnames are in FQDN format
1189 - The ``ganeti-watcher`` now activates drbd pairs after secondary node
1190   reboots
1191 - Removed dependency on debian's patched fping that uses the
1192   non-standard ``-S`` option
1193 - Now the OS definitions are searched for in multiple, configurable
1194   paths (easier for distros to package)
1195 - Some changes to the hooks infrastructure (especially the new
1196   post-configuration update hook)
1197 - Other small bugfixes
1198
1199 .. vim: set textwidth=72 syntax=rst :
1200 .. Local Variables:
1201 .. mode: rst
1202 .. fill-column: 72
1203 .. End: