CLI changes to facilitate shared storage migration/failover
[ganeti-local] / NEWS
1 News
2 ====
3
4 Version 2.5.0 beta1
5 -------------------
6
7 *(unreleased)*
8
9 - The default of the ``/2/instances/[instance_name]/rename`` RAPI
10   resource's ``ip_check`` parameter changed from ``True`` to ``False``
11   to match the underlying LUXI interface
12 - When creating file-based instances via RAPI, the ``file_driver``
13   parameter no longer defaults to ``loop`` and must be specified
14 - The deprecated "bridge" nic parameter is no longer supported. Use
15   "link" instead.
16
17
18 Version 2.4.0
19 -------------
20
21 *(Released Mon, 07 Mar 2011)*
22
23 Final 2.4.0 release. Just a few small fixes:
24
25 - Fixed RAPI node evacuate
26 - Fixed the kvm-ifup script
27 - Fixed internal error handling for special job cases
28 - Updated man page to specify the escaping feature for options
29
30
31 Version 2.4.0 rc3
32 -----------------
33
34 *(Released Mon, 28 Feb 2011)*
35
36 A critical fix for the ``prealloc_wipe_disks`` feature: it is possible
37 that this feature wiped the disks of the wrong instance, leading to loss
38 of data.
39
40 Other changes:
41
42 - Fixed title of query field containing instance name
43 - Expanded the glossary in the documentation
44 - Fixed one unittest (internal issue)
45
46
47 Version 2.4.0 rc2
48 -----------------
49
50 *(Released Mon, 21 Feb 2011)*
51
52 A number of bug fixes plus just a couple functionality changes.
53
54 On the user-visible side, the ``gnt-* list`` command output has changed
55 with respect to "special" field states. The current rc1 style of display
56 can be re-enabled by passing a new ``--verbose`` (``-v``) flag, but in
57 the default output mode special fields states are displayed as follows:
58
59 - Offline resource: ``*``
60 - Unavailable/not applicable: ``-``
61 - Data missing (RPC failure): ``?``
62 - Unknown field: ``??``
63
64 Another user-visible change is the addition of ``--force-join`` to
65 ``gnt-node add``.
66
67 As for bug fixes:
68
69 - ``tools/cluster-merge`` has seen many fixes and is now enabled again
70 - Fixed regression in RAPI/instance reinstall where all parameters were
71   required (instead of optional)
72 - Fixed ``gnt-cluster repair-disk-sizes``, was broken since Ganeti 2.2
73 - Fixed iallocator usage (offline nodes were not considered offline)
74 - Fixed ``gnt-node list`` with respect to non-vm_capable nodes
75 - Fixed hypervisor and OS parameter validation with respect to
76   non-vm_capable nodes
77 - Fixed ``gnt-cluster verify`` with respect to offline nodes (mostly
78   cosmetic)
79 - Fixed ``tools/listrunner`` with respect to agent-based usage
80
81
82 Version 2.4.0 rc1
83 -----------------
84
85 *(Released Fri,  4 Feb 2011)*
86
87 Many changes and fixes since the beta1 release. While there were some
88 internal changes, the code has been mostly stabilised for the RC
89 release.
90
91 Note: the dumb allocator was removed in this release, as it was not kept
92 up-to-date with the IAllocator protocol changes. It is recommended to
93 use the ``hail`` command from the ganeti-htools package.
94
95 Note: the 2.4 and up versions of Ganeti are not compatible with the
96 0.2.x branch of ganeti-htools. You need to upgrade to
97 ganeti-htools-0.3.0 (or later).
98
99 Regressions fixed from 2.3
100 ~~~~~~~~~~~~~~~~~~~~~~~~~~
101
102 - Fixed the ``gnt-cluster verify-disks`` command
103 - Made ``gnt-cluster verify-disks`` work in parallel (as opposed to
104   serially on nodes)
105 - Fixed disk adoption breakage
106 - Fixed wrong headers in instance listing for field aliases
107
108 Other bugs fixed
109 ~~~~~~~~~~~~~~~~
110
111 - Fixed corner case in KVM handling of NICs
112 - Fixed many cases of wrong handling of non-vm_capable nodes
113 - Fixed a bug where a missing instance symlink was not possible to
114   recreate with any ``gnt-*`` command (now ``gnt-instance
115   activate-disks`` does it)
116 - Fixed the volume group name as reported by ``gnt-cluster
117   verify-disks``
118 - Increased timeouts for the import-export code, hopefully leading to
119   fewer aborts due network or instance timeouts
120 - Fixed bug in ``gnt-node list-storage``
121 - Fixed bug where not all daemons were started on cluster
122   initialisation, but only at the first watcher run
123 - Fixed many bugs in the OOB implementation
124 - Fixed watcher behaviour in presence of instances with offline
125   secondaries
126 - Fixed instance list output for instances running on the wrong node
127 - a few fixes to the cluster-merge tool, but it still cannot merge
128   multi-node groups (currently it is not recommended to use this tool)
129
130
131 Improvements
132 ~~~~~~~~~~~~
133
134 - Improved network configuration for the KVM hypervisor
135 - Added e1000 as a supported NIC for Xen-HVM
136 - Improved the lvmstrap tool to also be able to use partitions, as
137   opposed to full disks
138 - Improved speed of disk wiping (the cluster parameter
139   ``prealloc_wipe_disks``, so that it has a low impact on the total time
140   of instance creations
141 - Added documentation for the OS parameters
142 - Changed ``gnt-instance deactivate-disks`` so that it can work if the
143   hypervisor is not responding
144 - Added display of blacklisted and hidden OS information in
145   ``gnt-cluster info``
146 - Extended ``gnt-cluster verify`` to also validate hypervisor, backend,
147   NIC and node parameters, which might create problems with currently
148   invalid (but undetected) configuration files, but prevents validation
149   failures when unrelated parameters are modified
150 - Changed cluster initialisation to wait for the master daemon to become
151   available
152 - Expanded the RAPI interface:
153
154   - Added config redistribution resource
155   - Added activation/deactivation of instance disks
156   - Added export of console information
157
158 - Implemented log file reopening on SIGHUP, which allows using
159   logrotate(8) for the Ganeti log files
160 - Added a basic OOB helper script as an example
161
162
163 Version 2.4.0 beta1
164 -------------------
165
166 *(Released Fri, 14 Jan 2011)*
167
168 User-visible
169 ~~~~~~~~~~~~
170
171 - Fixed timezone issues when formatting timestamps
172 - Added support for node groups, available via ``gnt-group`` and other
173   commands
174 - Added out-of-band framework and management, see :doc:`design
175   document <design-oob>`
176 - Removed support for roman numbers from ``gnt-node list`` and
177   ``gnt-instance list``.
178 - Allowed modification of master network interface via ``gnt-cluster
179   modify --master-netdev``
180 - Accept offline secondaries while shutting down instance disks
181 - Added ``blockdev_prefix`` parameter to Xen PVM and HVM hypervisors
182 - Added support for multiple LVM volume groups
183 - Avoid sorting nodes for ``gnt-node list`` if specific nodes are
184   requested
185 - Added commands to list available fields:
186
187   - ``gnt-node list-fields``
188   - ``gnt-group list-fields``
189   - ``gnt-instance list-fields``
190
191 - Updated documentation and man pages
192
193 Integration
194 ~~~~~~~~~~~
195
196 - Moved ``rapi_users`` file into separate directory, now named
197   ``.../ganeti/rapi/users``, ``cfgupgrade`` moves the file and creates a
198   symlink
199 - Added new tool for running commands on many machines,
200   ``tools/ganeti-listrunner``
201 - Implemented more verbose result in ``OpInstanceConsole`` opcode, also
202   improving the ``gnt-instance console`` output
203 - Allowed customisation of disk index separator at ``configure`` time
204 - Export node group allocation policy to :doc:`iallocator <iallocator>`
205 - Added support for non-partitioned md disks in ``lvmstrap``
206 - Added script to gracefully power off KVM instances
207 - Split ``utils`` module into smaller parts
208 - Changed query operations to return more detailed information, e.g.
209   whether an information is unavailable due to an offline node. To use
210   this new functionality, the LUXI call ``Query`` must be used. Field
211   information is now stored by the master daemon and can be retrieved
212   using ``QueryFields``. Instances, nodes and groups can also be queried
213   using the new opcodes ``OpQuery`` and ``OpQueryFields`` (not yet
214   exposed via RAPI). The following commands make use of this
215   infrastructure change:
216
217   - ``gnt-group list``
218   - ``gnt-group list-fields``
219   - ``gnt-node list``
220   - ``gnt-node list-fields``
221   - ``gnt-instance list``
222   - ``gnt-instance list-fields``
223   - ``gnt-debug locks``
224
225 Remote API
226 ~~~~~~~~~~
227
228 - New RAPI resources (see :doc:`rapi`):
229
230   - ``/2/modify``
231   - ``/2/groups``
232   - ``/2/groups/[group_name]``
233   - ``/2/groups/[group_name]/assign-nodes``
234   - ``/2/groups/[group_name]/modify``
235   - ``/2/groups/[group_name]/rename``
236   - ``/2/instances/[instance_name]/disk/[disk_index]/grow``
237
238 - RAPI changes:
239
240   - Implemented ``no_install`` for instance creation
241   - Implemented OS parameters for instance reinstallation, allowing
242     use of special settings on reinstallation (e.g. for preserving data)
243
244 Misc
245 ~~~~
246
247 - Added IPv6 support in import/export
248 - Pause DRBD synchronization while wiping disks on instance creation
249 - Updated unittests and QA scripts
250 - Improved network parameters passed to KVM
251 - Converted man pages from docbook to reStructuredText
252
253
254 Version 2.3.1
255 -------------
256
257 *(Released Mon, 20 Dec 2010)*
258
259 Released version 2.3.1~rc1 without any changes.
260
261
262 Version 2.3.1 rc1
263 -----------------
264
265 *(Released Wed, 1 Dec 2010)*
266
267 - impexpd: Disable OpenSSL compression in socat if possible (backport
268   from master, commit e90739d625b, see :doc:`installation guide
269   <install-quick>` for details)
270 - Changed unittest coverage report to exclude test scripts
271 - Added script to check version format
272
273
274 Version 2.3.0
275 -------------
276
277 *(Released Wed, 1 Dec 2010)*
278
279 Released version 2.3.0~rc1 without any changes.
280
281
282 Version 2.3.0 rc1
283 -----------------
284
285 *(Released Fri, 19 Nov 2010)*
286
287 A number of bugfixes and documentation updates:
288
289 - Update ganeti-os-interface documentation
290 - Fixed a bug related to duplicate MACs or similar items which should be
291   unique
292 - Fix breakage in OS state modify
293 - Reinstall instance: disallow offline secondaries (fixes bug related to
294   OS changing but reinstall failing)
295 - plus all the other fixes between 2.2.1 and 2.2.2
296
297
298 Version 2.3.0 rc0
299 -----------------
300
301 *(Released Tue, 2 Nov 2010)*
302
303 - Fixed clearing of the default iallocator using ``gnt-cluster modify``
304 - Fixed master failover race with watcher
305 - Fixed a bug in ``gnt-node modify`` which could lead to an inconsistent
306   configuration
307 - Accept previously stopped instance for export with instance removal
308 - Simplify and extend the environment variables for instance OS scripts
309 - Added new node flags, ``master_capable`` and ``vm_capable``
310 - Added optional instance disk wiping prior during allocation. This is a
311   cluster-wide option and can be set/modified using
312   ``gnt-cluster {init,modify} --prealloc-wipe-disks``.
313 - Added IPv6 support, see :doc:`design document <design-2.3>` and
314   :doc:`install-quick`
315 - Added a new watcher option (``--ignore-pause``)
316 - Added option to ignore offline node on instance start/stop
317   (``--ignore-offline``)
318 - Allow overriding OS parameters with ``gnt-instance reinstall``
319 - Added ability to change node's secondary IP address using ``gnt-node
320   modify``
321 - Implemented privilege separation for all daemons except
322   ``ganeti-noded``, see ``configure`` options
323 - Complain if an instance's disk is marked faulty in ``gnt-cluster
324   verify``
325 - Implemented job priorities (see ``ganeti(7)`` manpage)
326 - Ignore failures while shutting down instances during failover from
327   offline node
328 - Exit daemon's bootstrap process only once daemon is ready
329 - Export more information via ``LUInstanceQuery``/remote API
330 - Improved documentation, QA and unittests
331 - RAPI daemon now watches ``rapi_users`` all the time and doesn't need a
332   restart if the file was created or changed
333 - Added LUXI protocol version sent with each request and response,
334   allowing detection of server/client mismatches
335 - Moved the Python scripts among gnt-* and ganeti-* into modules
336 - Moved all code related to setting up SSH to an external script,
337   ``setup-ssh``
338 - Infrastructure changes for node group support in future versions
339
340
341 Version 2.2.2
342 -------------
343
344 *(Released Fri, 19 Nov 2010)*
345
346 A few small bugs fixed, and some improvements to the build system:
347
348 - Fix documentation regarding conversion to drbd
349 - Fix validation of parameters in cluster modify (``gnt-cluster modify
350   -B``)
351 - Fix error handling in node modify with multiple changes
352 - Allow remote imports without checked names
353
354
355 Version 2.2.1
356 -------------
357
358 *(Released Tue, 19 Oct 2010)*
359
360 - Disable SSL session ID cache in RPC client
361
362
363 Version 2.2.1 rc1
364 -----------------
365
366 *(Released Thu, 14 Oct 2010)*
367
368 - Fix interaction between Curl/GnuTLS and the Python's HTTP server
369   (thanks Apollon Oikonomopoulos!), finally allowing the use of Curl
370   with GnuTLS
371 - Fix problems with interaction between Curl and Python's HTTP server,
372   resulting in increased speed in many RPC calls
373 - Improve our release script to prevent breakage with older aclocal and
374   Python 2.6
375
376
377 Version 2.2.1 rc0
378 -----------------
379
380 *(Released Thu, 7 Oct 2010)*
381
382 - Fixed issue 125, replace hardcoded "xenvg" in ``gnt-cluster`` with
383   value retrieved from master
384 - Added support for blacklisted or hidden OS definitions
385 - Added simple lock monitor (accessible via (``gnt-debug locks``)
386 - Added support for -mem-path in KVM hypervisor abstraction layer
387 - Allow overriding instance parameters in tool for inter-cluster
388   instance moves (``tools/move-instance``)
389 - Improved opcode summaries (e.g. in ``gnt-job list``)
390 - Improve consistency of OS listing by sorting it
391 - Documentation updates
392
393
394 Version 2.2.0.1
395 ---------------
396
397 *(Released Fri, 8 Oct 2010)*
398
399 - Rebuild with a newer autotools version, to fix python 2.6 compatibility
400
401
402 Version 2.2.0
403 -------------
404
405 *(Released Mon, 4 Oct 2010)*
406
407 - Fixed regression in ``gnt-instance rename``
408
409
410 Version 2.2.0 rc2
411 -----------------
412
413 *(Released Wed, 22 Sep 2010)*
414
415 - Fixed OS_VARIANT variable for OS scripts
416 - Fixed cluster tag operations via RAPI
417 - Made ``setup-ssh`` exit with non-zero code if an error occurred
418 - Disabled RAPI CA checks in watcher
419
420
421 Version 2.2.0 rc1
422 -----------------
423
424 *(Released Mon, 23 Aug 2010)*
425
426 - Support DRBD versions of the format "a.b.c.d"
427 - Updated manpages
428 - Re-introduce support for usage from multiple threads in RAPI client
429 - Instance renames and modify via RAPI
430 - Work around race condition between processing and archival in job
431   queue
432 - Mark opcodes following failed one as failed, too
433 - Job field ``lock_status`` was removed due to difficulties making it
434   work with the changed job queue in Ganeti 2.2; a better way to monitor
435   locks is expected for a later 2.2.x release
436 - Fixed dry-run behaviour with many commands
437 - Support ``ssh-agent`` again when adding nodes
438 - Many additional bugfixes
439
440
441 Version 2.2.0 rc0
442 -----------------
443
444 *(Released Fri, 30 Jul 2010)*
445
446 Important change: the internal RPC mechanism between Ganeti nodes has
447 changed from using a home-grown http library (based on the Python base
448 libraries) to use the PycURL library. This requires that PycURL is
449 installed on nodes. Please note that on Debian/Ubuntu, PycURL is linked
450 against GnuTLS by default. cURL's support for GnuTLS had known issues
451 before cURL 7.21.0 and we recommend using the latest cURL release or
452 linking against OpenSSL. Most other distributions already link PycURL
453 and cURL against OpenSSL. The command::
454
455   python -c 'import pycurl; print pycurl.version'
456
457 can be used to determine the libraries PycURL and cURL are linked
458 against.
459
460 Other significant changes:
461
462 - Rewrote much of the internals of the job queue, in order to achieve
463   better parallelism; this decouples job query operations from the job
464   processing, and it should allow much nicer behaviour of the master
465   daemon under load, and it also has uncovered some long-standing bugs
466   related to the job serialisation (now fixed)
467 - Added a default iallocator setting to the cluster parameters,
468   eliminating the need to always pass nodes or an iallocator for
469   operations that require selection of new node(s)
470 - Added experimental support for the LXC virtualization method
471 - Added support for OS parameters, which allows the installation of
472   instances to pass parameter to OS scripts in order to customise the
473   instance
474 - Added a hypervisor parameter controlling the migration type (live or
475   non-live), since hypervisors have various levels of reliability; this
476   has renamed the 'live' parameter to 'mode'
477 - Added a cluster parameter ``reserved_lvs`` that denotes reserved
478   logical volumes, meaning that cluster verify will ignore them and not
479   flag their presence as errors
480 - The watcher will now reset the error count for failed instances after
481   8 hours, thus allowing self-healing if the problem that caused the
482   instances to be down/fail to start has cleared in the meantime
483 - Added a cluster parameter ``drbd_usermode_helper`` that makes Ganeti
484   check for, and warn, if the drbd module parameter ``usermode_helper``
485   is not consistent with the cluster-wide setting; this is needed to
486   make diagnose easier of failed drbd creations
487 - Started adding base IPv6 support, but this is not yet
488   enabled/available for use
489 - Rename operations (cluster, instance) will now return the new name,
490   which is especially useful if a short name was passed in
491 - Added support for instance migration in RAPI
492 - Added a tool to pre-configure nodes for the SSH setup, before joining
493   them to the cluster; this will allow in the future a simplified model
494   for node joining (but not yet fully enabled in 2.2); this needs the
495   paramiko python library
496 - Fixed handling of name-resolving errors
497 - Fixed consistency of job results on the error path
498 - Fixed master-failover race condition when executed multiple times in
499   sequence
500 - Fixed many bugs related to the job queue (mostly introduced during the
501   2.2 development cycle, so not all are impacting 2.1)
502 - Fixed instance migration with missing disk symlinks
503 - Fixed handling of unknown jobs in ``gnt-job archive``
504 - And many other small fixes/improvements
505
506 Internal changes:
507
508 - Enhanced both the unittest and the QA coverage
509 - Switched the opcode validation to a generic model, and extended the
510   validation to all opcode parameters
511 - Changed more parts of the code that write shell scripts to use the
512   same class for this
513 - Switched the master daemon to use the asyncore library for the Luxi
514   server endpoint
515
516
517 Version 2.2.0 beta 0
518 --------------------
519
520 *(Released Thu, 17 Jun 2010)*
521
522 - Added tool (``move-instance``) and infrastructure to move instances
523   between separate clusters (see :doc:`separate documentation
524   <move-instance>` and :doc:`design document <design-2.2>`)
525 - Added per-request RPC timeout
526 - RAPI now requires a Content-Type header for requests with a body (e.g.
527   ``PUT`` or ``POST``) which must be set to ``application/json`` (see
528   :rfc:`2616` (HTTP/1.1), section 7.2.1)
529 - ``ganeti-watcher`` attempts to restart ``ganeti-rapi`` if RAPI is not
530   reachable
531 - Implemented initial support for running Ganeti daemons as separate
532   users, see configure-time flags ``--with-user-prefix`` and
533   ``--with-group-prefix`` (only ``ganeti-rapi`` is supported at this
534   time)
535 - Instances can be removed after export (``gnt-backup export
536   --remove-instance``)
537 - Self-signed certificates generated by Ganeti now use a 2048 bit RSA
538   key (instead of 1024 bit)
539 - Added new cluster configuration file for cluster domain secret
540 - Import/export now use SSL instead of SSH
541 - Added support for showing estimated time when exporting an instance,
542   see the ``ganeti-os-interface(7)`` manpage and look for
543   ``EXP_SIZE_FD``
544
545
546 Version 2.1.8
547 -------------
548
549 *(Released Tue, 16 Nov 2010)*
550
551 Some more bugfixes. Unless critical bugs occur, this will be the last
552 2.1 release:
553
554 - Fix case of MAC special-values
555 - Fix mac checker regex
556 - backend: Fix typo causing "out of range" error
557 - Add missing --units in gnt-instance list man page
558
559
560 Version 2.1.7
561 -------------
562
563 *(Released Tue, 24 Aug 2010)*
564
565 Bugfixes only:
566   - Don't ignore secondary node silently on non-mirrored disk templates
567     (issue 113)
568   - Fix --master-netdev arg name in gnt-cluster(8) (issue 114)
569   - Fix usb_mouse parameter breaking with vnc_console (issue 109)
570   - Properly document the usb_mouse parameter
571   - Fix path in ganeti-rapi(8) (issue 116)
572   - Adjust error message when the ganeti user's .ssh directory is
573     missing
574   - Add same-node-check when changing the disk template to drbd
575
576
577 Version 2.1.6
578 -------------
579
580 *(Released Fri, 16 Jul 2010)*
581
582 Bugfixes only:
583   - Add an option to only select some reboot types during qa/burnin.
584     (on some hypervisors consequent reboots are not supported)
585   - Fix infrequent race condition in master failover. Sometimes the old
586     master ip address would be still detected as up for a short time
587     after it was removed, causing failover to fail.
588   - Decrease mlockall warnings when the ctypes module is missing. On
589     Python 2.4 we support running even if no ctypes module is installed,
590     but we were too verbose about this issue.
591   - Fix building on old distributions, on which man doesn't have a
592     --warnings option.
593   - Fix RAPI not to ignore the MAC address on instance creation
594   - Implement the old instance creation format in the RAPI client.
595
596
597 Version 2.1.5
598 -------------
599
600 *(Released Thu, 01 Jul 2010)*
601
602 A small bugfix release:
603   - Fix disk adoption: broken by strict --disk option checking in 2.1.4
604   - Fix batch-create: broken in the whole 2.1 series due to a lookup on
605     a non-existing option
606   - Fix instance create: the --force-variant option was ignored
607   - Improve pylint 0.21 compatibility and warnings with Python 2.6
608   - Fix modify node storage with non-FQDN arguments
609   - Fix RAPI client to authenticate under Python 2.6 when used
610     for more than 5 requests needing authentication
611   - Fix gnt-instance modify -t (storage) giving a wrong error message
612     when converting a non-shutdown drbd instance to plain
613
614
615 Version 2.1.4
616 -------------
617
618 *(Released Fri, 18 Jun 2010)*
619
620 A small bugfix release:
621
622   - Fix live migration of KVM instances started with older Ganeti
623     versions which had fewer hypervisor parameters
624   - Fix gnt-instance grow-disk on down instances
625   - Fix an error-reporting bug during instance migration
626   - Better checking of the ``--net`` and ``--disk`` values, to avoid
627     silently ignoring broken ones
628   - Fix an RPC error reporting bug affecting, for example, RAPI client
629     users
630   - Fix bug triggered by different API version os-es on different nodes
631   - Fix a bug in instance startup with custom hvparams: OS level
632     parameters would fail to be applied.
633   - Fix the RAPI client under Python 2.6 (but more work is needed to
634     make it work completely well with OpenSSL)
635   - Fix handling of errors when resolving names from DNS
636
637
638 Version 2.1.3
639 -------------
640
641 *(Released Thu, 3 Jun 2010)*
642
643 A medium sized development cycle. Some new features, and some
644 fixes/small improvements/cleanups.
645
646 Significant features
647 ~~~~~~~~~~~~~~~~~~~~
648
649 The node deamon now tries to mlock itself into memory, unless the
650 ``--no-mlock`` flag is passed. It also doesn't fail if it can't write
651 its logs, and falls back to console logging. This allows emergency
652 features such as ``gnt-node powercycle`` to work even in the event of a
653 broken node disk (tested offlining the disk hosting the node's
654 filesystem and dropping its memory caches; don't try this at home)
655
656 KVM: add vhost-net acceleration support. It can be tested with a new
657 enough version of the kernel and of qemu-kvm.
658
659 KVM: Add instance chrooting feature. If you use privilege dropping for
660 your VMs you can also now force them to chroot to an empty directory,
661 before starting the emulated guest.
662
663 KVM: Add maximum migration bandwith and maximum downtime tweaking
664 support (requires a new-enough version of qemu-kvm).
665
666 Cluster verify will now warn if the master node doesn't have the master
667 ip configured on it.
668
669 Add a new (incompatible) instance creation request format to RAPI which
670 supports all parameters (previously only a subset was supported, and it
671 wasn't possible to extend the old format to accomodate all the new
672 features. The old format is still supported, and a client can check for
673 this feature, before using it, by checking for its presence in the
674 ``features`` RAPI resource.
675
676 Now with ancient latin support. Try it passing the ``--roman`` option to
677 ``gnt-instance info``, ``gnt-cluster info`` or ``gnt-node list``
678 (requires the python-roman module to be installed, in order to work).
679
680 Other changes
681 ~~~~~~~~~~~~~
682
683 As usual many internal code refactorings, documentation updates, and
684 such. Among others:
685
686   - Lots of improvements and cleanups to the experimental Remote API
687     (RAPI) client library.
688   - A new unit test suite for the core daemon libraries.
689   - A fix to creating missing directories makes sure the umask is not
690     applied anymore. This enforces the same directory permissions
691     everywhere.
692   - Better handling terminating daemons with ctrl+c (used when running
693     them in debugging mode).
694   - Fix a race condition in live migrating a KVM instance, when stat()
695     on the old proc status file returned EINVAL, which is an unexpected
696     value.
697   - Fixed manpage checking with newer man and utf-8 charachters. But now
698     you need the en_US.UTF-8 locale enabled to build Ganeti from git.
699
700
701 Version 2.1.2.1
702 ---------------
703
704 *(Released Fri, 7 May 2010)*
705
706 Fix a bug which prevented untagged KVM instances from starting.
707
708
709 Version 2.1.2
710 -------------
711
712 *(Released Fri, 7 May 2010)*
713
714 Another release with a long development cycle, during which many
715 different features were added.
716
717 Significant features
718 ~~~~~~~~~~~~~~~~~~~~
719
720 The KVM hypervisor now can run the individual instances as non-root, to
721 reduce the impact of a VM being hijacked due to bugs in the
722 hypervisor. It is possible to run all instances as a single (non-root)
723 user, to manually specify a user for each instance, or to dynamically
724 allocate a user out of a cluster-wide pool to each instance, with the
725 guarantee that no two instances will run under the same user ID on any
726 given node.
727
728 An experimental RAPI client library, that can be used standalone
729 (without the other Ganeti libraries), is provided in the source tree as
730 ``lib/rapi/client.py``. Note this client might change its interface in
731 the future, as we iterate on its capabilities.
732
733 A new command, ``gnt-cluster renew-crypto`` has been added to easily
734 replace the cluster's certificates and crypto keys. This might help in
735 case they have been compromised, or have simply expired.
736
737 A new disk option for instance creation has been added that allows one
738 to "adopt" currently existing logical volumes, with data
739 preservation. This should allow easier migration to Ganeti from
740 unmanaged (or managed via other software) instances.
741
742 Another disk improvement is the possibility to convert between redundant
743 (DRBD) and plain (LVM) disk configuration for an instance. This should
744 allow better scalability (starting with one node and growing the
745 cluster, or shrinking a two-node cluster to one node).
746
747 A new feature that could help with automated node failovers has been
748 implemented: if a node sees itself as offline (by querying the master
749 candidates), it will try to shutdown (hard) all instances and any active
750 DRBD devices. This reduces the risk of duplicate instances if an
751 external script automatically failovers the instances on such nodes. To
752 enable this, the cluster parameter ``maintain_node_health`` should be
753 enabled; in the future this option (per the name) will enable other
754 automatic maintenance features.
755
756 Instance export/import now will reuse the original instance
757 specifications for all parameters; that means exporting an instance,
758 deleting it and the importing it back should give an almost identical
759 instance. Note that the default import behaviour has changed from
760 before, where it created only one NIC; now it recreates the original
761 number of NICs.
762
763 Cluster verify has added a few new checks: SSL certificates validity,
764 /etc/hosts consistency across the cluster, etc.
765
766 Other changes
767 ~~~~~~~~~~~~~
768
769 As usual, many internal changes were done, documentation fixes,
770 etc. Among others:
771
772 - Fixed cluster initialization with disabled cluster storage (regression
773   introduced in 2.1.1)
774 - File-based storage supports growing the disks
775 - Fixed behaviour of node role changes
776 - Fixed cluster verify for some corner cases, plus a general rewrite of
777   cluster verify to allow future extension with more checks
778 - Fixed log spamming by watcher and node daemon (regression introduced
779   in 2.1.1)
780 - Fixed possible validation issues when changing the list of enabled
781   hypervisors
782 - Fixed cleanup of /etc/hosts during node removal
783 - Fixed RAPI response for invalid methods
784 - Fixed bug with hashed passwords in ``ganeti-rapi`` daemon
785 - Multiple small improvements to the KVM hypervisor (VNC usage, booting
786   from ide disks, etc.)
787 - Allow OS changes without re-installation (to record a changed OS
788   outside of Ganeti, or to allow OS renames)
789 - Allow instance creation without OS installation (useful for example if
790   the OS will be installed manually, or restored from a backup not in
791   Ganeti format)
792 - Implemented option to make cluster ``copyfile`` use the replication
793   network
794 - Added list of enabled hypervisors to ssconf (possibly useful for
795   external scripts)
796 - Added a new tool (``tools/cfgupgrade12``) that allows upgrading from
797   1.2 clusters
798 - A partial form of node re-IP is possible via node readd, which now
799   allows changed node primary IP
800 - Command line utilities now show an informational message if the job is
801   waiting for a lock
802 - The logs of the master daemon now show the PID/UID/GID of the
803   connected client
804
805
806 Version 2.1.1
807 -------------
808
809 *(Released Fri, 12 Mar 2010)*
810
811 During the 2.1.0 long release candidate cycle, a lot of improvements and
812 changes have accumulated with were released later as 2.1.1.
813
814 Major changes
815 ~~~~~~~~~~~~~
816
817 The node evacuate command (``gnt-node evacuate``) was significantly
818 rewritten, and as such the IAllocator protocol was changed - a new
819 request type has been added. This unfortunate change during a stable
820 series is designed to improve performance of node evacuations; on
821 clusters with more than about five nodes and which are well-balanced,
822 evacuation should proceed in parallel for all instances of the node
823 being evacuated. As such, any existing IAllocator scripts need to be
824 updated, otherwise the above command will fail due to the unknown
825 request. The provided "dumb" allocator has not been updated; but the
826 ganeti-htools package supports the new protocol since version 0.2.4.
827
828 Another important change is increased validation of node and instance
829 names. This might create problems in special cases, if invalid host
830 names are being used.
831
832 Also, a new layer of hypervisor parameters has been added, that sits at
833 OS level between the cluster defaults and the instance ones. This allows
834 customisation of virtualization parameters depending on the installed
835 OS. For example instances with OS 'X' may have a different KVM kernel
836 (or any other parameter) than the cluster defaults. This is intended to
837 help managing a multiple OSes on the same cluster, without manual
838 modification of each instance's parameters.
839
840 A tool for merging clusters, ``cluster-merge``, has been added in the
841 tools sub-directory.
842
843 Bug fixes
844 ~~~~~~~~~
845
846 - Improved the int/float conversions that should make the code more
847   robust in face of errors from the node daemons
848 - Fixed the remove node code in case of internal configuration errors
849 - Fixed the node daemon behaviour in face of inconsistent queue
850   directory (e.g. read-only file-system where we can't open the files
851   read-write, etc.)
852 - Fixed the behaviour of gnt-node modify for master candidate demotion;
853   now it either aborts cleanly or, if given the new "auto_promote"
854   parameter, will automatically promote other nodes as needed
855 - Fixed compatibility with (unreleased yet) Python 2.6.5 that would
856   completely prevent Ganeti from working
857 - Fixed bug for instance export when not all disks were successfully
858   exported
859 - Fixed behaviour of node add when the new node is slow in starting up
860   the node daemon
861 - Fixed handling of signals in the LUXI client, which should improve
862   behaviour of command-line scripts
863 - Added checks for invalid node/instance names in the configuration (now
864   flagged during cluster verify)
865 - Fixed watcher behaviour for disk activation errors
866 - Fixed two potentially endless loops in http library, which led to the
867   RAPI daemon hanging and consuming 100% CPU in some cases
868 - Fixed bug in RAPI daemon related to hashed passwords
869 - Fixed bug for unintended qemu-level bridging of multi-NIC KVM
870   instances
871 - Enhanced compatibility with non-Debian OSes, but not using absolute
872   path in some commands and allowing customisation of the ssh
873   configuration directory
874 - Fixed possible future issue with new Python versions by abiding to the
875   proper use of ``__slots__`` attribute on classes
876 - Added checks that should prevent directory traversal attacks
877 - Many documentation fixes based on feedback from users
878
879 New features
880 ~~~~~~~~~~~~
881
882 - Added an "early_release" more for instance replace disks and node
883   evacuate, where we release locks earlier and thus allow higher
884   parallelism within the cluster
885 - Added watcher hooks, intended to allow the watcher to restart other
886   daemons (e.g. from the ganeti-nbma project), but they can be used of
887   course for any other purpose
888 - Added a compile-time disable for DRBD barriers, to increase
889   performance if the administrator trusts the power supply or the
890   storage system to not lose writes
891 - Added the option of using syslog for logging instead of, or in
892   addition to, Ganeti's own log files
893 - Removed boot restriction for paravirtual NICs for KVM, recent versions
894   can indeed boot from a paravirtual NIC
895 - Added a generic debug level for many operations; while this is not
896   used widely yet, it allows one to pass the debug value all the way to
897   the OS scripts
898 - Enhanced the hooks environment for instance moves (failovers,
899   migrations) where the primary/secondary nodes changed during the
900   operation, by adding {NEW,OLD}_{PRIMARY,SECONDARY} vars
901 - Enhanced data validations for many user-supplied values; one important
902   item is the restrictions imposed on instance and node names, which
903   might reject some (invalid) host names
904 - Add a configure-time option to disable file-based storage, if it's not
905   needed; this allows greater security separation between the master
906   node and the other nodes from the point of view of the inter-node RPC
907   protocol
908 - Added user notification in interactive tools if job is waiting in the
909   job queue or trying to acquire locks
910 - Added log messages when a job is waiting for locks
911 - Added filtering by node tags in instance operations which admit
912   multiple instances (start, stop, reboot, reinstall)
913 - Added a new tool for cluster mergers, ``cluster-merge``
914 - Parameters from command line which are of the form ``a=b,c=d`` can now
915   use backslash escapes to pass in values which contain commas,
916   e.g. ``a=b\\c,d=e`` where the 'a' parameter would get the value
917   ``b,c``
918 - For KVM, the instance name is the first parameter passed to KVM, so
919   that it's more visible in the process list
920
921
922 Version 2.1.0
923 -------------
924
925 *(Released Tue, 2 Mar 2010)*
926
927 Ganeti 2.1 brings many improvements with it. Major changes:
928
929 - Added infrastructure to ease automated disk repairs
930 - Added new daemon to export configuration data in a cheaper way than
931   using the remote API
932 - Instance NICs can now be routed instead of being associated with a
933   networking bridge
934 - Improved job locking logic to reduce impact of jobs acquiring multiple
935   locks waiting for other long-running jobs
936
937 In-depth implementation details can be found in the Ganeti 2.1 design
938 document.
939
940 Details
941 ~~~~~~~
942
943 - Added chroot hypervisor
944 - Added more options to xen-hvm hypervisor (``kernel_path`` and
945   ``device_model``)
946 - Added more options to xen-pvm hypervisor (``use_bootloader``,
947   ``bootloader_path`` and ``bootloader_args``)
948 - Added the ``use_localtime`` option for the xen-hvm and kvm
949   hypervisors, and the default value for this has changed to false (in
950   2.0 xen-hvm always enabled it)
951 - Added luxi call to submit multiple jobs in one go
952 - Added cluster initialization option to not modify ``/etc/hosts``
953   file on nodes
954 - Added network interface parameters
955 - Added dry run mode to some LUs
956 - Added RAPI resources:
957
958   - ``/2/instances/[instance_name]/info``
959   - ``/2/instances/[instance_name]/replace-disks``
960   - ``/2/nodes/[node_name]/evacuate``
961   - ``/2/nodes/[node_name]/migrate``
962   - ``/2/nodes/[node_name]/role``
963   - ``/2/nodes/[node_name]/storage``
964   - ``/2/nodes/[node_name]/storage/modify``
965   - ``/2/nodes/[node_name]/storage/repair``
966
967 - Added OpCodes to evacuate or migrate all instances on a node
968 - Added new command to list storage elements on nodes (``gnt-node
969   list-storage``) and modify them (``gnt-node modify-storage``)
970 - Added new ssconf files with master candidate IP address
971   (``ssconf_master_candidates_ips``), node primary IP address
972   (``ssconf_node_primary_ips``) and node secondary IP address
973   (``ssconf_node_secondary_ips``)
974 - Added ``ganeti-confd`` and a client library to query the Ganeti
975   configuration via UDP
976 - Added ability to run hooks after cluster initialization and before
977   cluster destruction
978 - Added automatic mode for disk replace (``gnt-instance replace-disks
979   --auto``)
980 - Added ``gnt-instance recreate-disks`` to re-create (empty) disks
981   after catastrophic data-loss
982 - Added ``gnt-node repair-storage`` command to repair damaged LVM volume
983   groups
984 - Added ``gnt-instance move`` command to move instances
985 - Added ``gnt-cluster watcher`` command to control watcher
986 - Added ``gnt-node powercycle`` command to powercycle nodes
987 - Added new job status field ``lock_status``
988 - Added parseable error codes to cluster verification (``gnt-cluster
989   verify --error-codes``) and made output less verbose (use
990   ``--verbose`` to restore previous behaviour)
991 - Added UUIDs to the main config entities (cluster, nodes, instances)
992 - Added support for OS variants
993 - Added support for hashed passwords in the Ganeti remote API users file
994   (``rapi_users``)
995 - Added option to specify maximum timeout on instance shutdown
996 - Added ``--no-ssh-init`` option to ``gnt-cluster init``
997 - Added new helper script to start and stop Ganeti daemons
998   (``daemon-util``), with the intent to reduce the work necessary to
999   adjust Ganeti for non-Debian distributions and to start/stop daemons
1000   from one place
1001 - Added more unittests
1002 - Fixed critical bug in ganeti-masterd startup
1003 - Removed the configure-time ``kvm-migration-port`` parameter, this is
1004   now customisable at the cluster level for both the KVM and Xen
1005   hypervisors using the new ``migration_port`` parameter
1006 - Pass ``INSTANCE_REINSTALL`` variable to OS installation script when
1007   reinstalling an instance
1008 - Allowed ``@`` in tag names
1009 - Migrated to Sphinx (http://sphinx.pocoo.org/) for documentation
1010 - Many documentation updates
1011 - Distribute hypervisor files on ``gnt-cluster redist-conf``
1012 - ``gnt-instance reinstall`` can now reinstall multiple instances
1013 - Updated many command line parameters
1014 - Introduced new OS API version 15
1015 - No longer support a default hypervisor
1016 - Treat virtual LVs as inexistent
1017 - Improved job locking logic to reduce lock contention
1018 - Match instance and node names case insensitively
1019 - Reimplemented bash completion script to be more complete
1020 - Improved burnin
1021
1022
1023 Version 2.0.6
1024 -------------
1025
1026 *(Released Thu, 4 Feb 2010)*
1027
1028 - Fix cleaner behaviour on nodes not in a cluster (Debian bug 568105)
1029 - Fix a string formatting bug
1030 - Improve safety of the code in some error paths
1031 - Improve data validation in the master of values returned from nodes
1032
1033
1034 Version 2.0.5
1035 -------------
1036
1037 *(Released Thu, 17 Dec 2009)*
1038
1039 - Fix security issue due to missing validation of iallocator names; this
1040   allows local and remote execution of arbitrary executables
1041 - Fix failure of gnt-node list during instance removal
1042 - Ship the RAPI documentation in the archive
1043
1044
1045 Version 2.0.4
1046 -------------
1047
1048 *(Released Wed, 30 Sep 2009)*
1049
1050 - Fixed many wrong messages
1051 - Fixed a few bugs related to the locking library
1052 - Fixed MAC checking at instance creation time
1053 - Fixed a DRBD parsing bug related to gaps in /proc/drbd
1054 - Fixed a few issues related to signal handling in both daemons and
1055   scripts
1056 - Fixed the example startup script provided
1057 - Fixed insserv dependencies in the example startup script (patch from
1058   Debian)
1059 - Fixed handling of drained nodes in the iallocator framework
1060 - Fixed handling of KERNEL_PATH parameter for xen-hvm (Debian bug
1061   #528618)
1062 - Fixed error related to invalid job IDs in job polling
1063 - Fixed job/opcode persistence on unclean master shutdown
1064 - Fixed handling of partial job processing after unclean master
1065   shutdown
1066 - Fixed error reporting from LUs, previously all errors were converted
1067   into execution errors
1068 - Fixed error reporting from burnin
1069 - Decreased significantly the memory usage of the job queue
1070 - Optimised slightly multi-job submission
1071 - Optimised slightly opcode loading
1072 - Backported the multi-job submit framework from the development
1073   branch; multi-instance start and stop should be faster
1074 - Added script to clean archived jobs after 21 days; this will reduce
1075   the size of the queue directory
1076 - Added some extra checks in disk size tracking
1077 - Added an example ethers hook script
1078 - Added a cluster parameter that prevents Ganeti from modifying of
1079   /etc/hosts
1080 - Added more node information to RAPI responses
1081 - Added a ``gnt-job watch`` command that allows following the ouput of a
1082   job
1083 - Added a bind-address option to ganeti-rapi
1084 - Added more checks to the configuration verify
1085 - Enhanced the burnin script such that some operations can be retried
1086   automatically
1087 - Converted instance reinstall to multi-instance model
1088
1089
1090 Version 2.0.3
1091 -------------
1092
1093 *(Released Fri, 7 Aug 2009)*
1094
1095 - Added ``--ignore-size`` to the ``gnt-instance activate-disks`` command
1096   to allow using the pre-2.0.2 behaviour in activation, if any existing
1097   instances have mismatched disk sizes in the configuration
1098 - Added ``gnt-cluster repair-disk-sizes`` command to check and update
1099   any configuration mismatches for disk sizes
1100 - Added ``gnt-master cluste-failover --no-voting`` to allow master
1101   failover to work on two-node clusters
1102 - Fixed the ``--net`` option of ``gnt-backup import``, which was
1103   unusable
1104 - Fixed detection of OS script errors in ``gnt-backup export``
1105 - Fixed exit code of ``gnt-backup export``
1106
1107
1108 Version 2.0.2
1109 -------------
1110
1111 *(Released Fri, 17 Jul 2009)*
1112
1113 - Added experimental support for stripped logical volumes; this should
1114   enhance performance but comes with a higher complexity in the block
1115   device handling; stripping is only enabled when passing
1116   ``--with-lvm-stripecount=N`` to ``configure``, but codepaths are
1117   affected even in the non-stripped mode
1118 - Improved resiliency against transient failures at the end of DRBD
1119   resyncs, and in general of DRBD resync checks
1120 - Fixed a couple of issues with exports and snapshot errors
1121 - Fixed a couple of issues in instance listing
1122 - Added display of the disk size in ``gnt-instance info``
1123 - Fixed checking for valid OSes in instance creation
1124 - Fixed handling of the "vcpus" parameter in instance listing and in
1125   general of invalid parameters
1126 - Fixed http server library, and thus RAPI, to handle invalid
1127   username/password combinations correctly; this means that now they
1128   report unauthorized for queries too, not only for modifications,
1129   allowing earlier detect of configuration problems
1130 - Added a new "role" node list field, equivalent to the master/master
1131   candidate/drained/offline flags combinations
1132 - Fixed cluster modify and changes of candidate pool size
1133 - Fixed cluster verify error messages for wrong files on regular nodes
1134 - Fixed a couple of issues with node demotion from master candidate role
1135 - Fixed node readd issues
1136 - Added non-interactive mode for ``ganeti-masterd --no-voting`` startup
1137 - Added a new ``--no-voting`` option for masterfailover to fix failover
1138   on two-nodes clusters when the former master node is unreachable
1139 - Added instance reinstall over RAPI
1140
1141
1142 Version 2.0.1
1143 -------------
1144
1145 *(Released Tue, 16 Jun 2009)*
1146
1147 - added ``-H``/``-B`` startup parameters to ``gnt-instance``, which will
1148   allow re-adding the start in single-user option (regression from 1.2)
1149 - the watcher writes the instance status to a file, to allow monitoring
1150   to report the instance status (from the master) based on cached
1151   results of the watcher's queries; while this can get stale if the
1152   watcher is being locked due to other work on the cluster, this is
1153   still an improvement
1154 - the watcher now also restarts the node daemon and the rapi daemon if
1155   they died
1156 - fixed the watcher to handle full and drained queue cases
1157 - hooks export more instance data in the environment, which helps if
1158   hook scripts need to take action based on the instance's properties
1159   (no longer need to query back into ganeti)
1160 - instance failovers when the instance is stopped do not check for free
1161   RAM, so that failing over a stopped instance is possible in low memory
1162   situations
1163 - rapi uses queries for tags instead of jobs (for less job traffic), and
1164   for cluster tags it won't talk to masterd at all but read them from
1165   ssconf
1166 - a couple of error handling fixes in RAPI
1167 - drbd handling: improved the error handling of inconsistent disks after
1168   resync to reduce the frequency of "there are some degraded disks for
1169   this instance" messages
1170 - fixed a bug in live migration when DRBD doesn't want to reconnect (the
1171   error handling path called a wrong function name)
1172
1173
1174 Version 2.0.0 final
1175 -------------------
1176
1177 *(Released Wed, 27 May 2009)*
1178
1179 - no changes from rc5
1180
1181
1182 Version 2.0 release candidate 5
1183 -------------------------------
1184
1185 *(Released Wed, 20 May 2009)*
1186
1187 - fix a couple of bugs (validation, argument checks)
1188 - fix ``gnt-cluster getmaster`` on non-master nodes (regression)
1189 - some small improvements to RAPI and IAllocator
1190 - make watcher automatically start the master daemon if down
1191
1192
1193 Version 2.0 release candidate 4
1194 -------------------------------
1195
1196 *(Released Mon, 27 Apr 2009)*
1197
1198 - change the OS list to not require locks; this helps with big clusters
1199 - fix ``gnt-cluster verify`` and ``gnt-cluster verify-disks`` when the
1200   volume group is broken
1201 - ``gnt-instance info``, without any arguments, doesn't run for all
1202   instances anymore; either pass ``--all`` or pass the desired
1203   instances; this helps against mistakes on big clusters where listing
1204   the information for all instances takes a long time
1205 - miscellaneous doc and man pages fixes
1206
1207
1208 Version 2.0 release candidate 3
1209 -------------------------------
1210
1211 *(Released Wed, 8 Apr 2009)*
1212
1213 - Change the internal locking model of some ``gnt-node`` commands, in
1214   order to reduce contention (and blocking of master daemon) when
1215   batching many creation/reinstall jobs
1216 - Fixes to Xen soft reboot
1217 - No longer build documentation at build time, instead distribute it in
1218   the archive, in order to reduce the need for the whole docbook/rst
1219   toolchains
1220
1221
1222 Version 2.0 release candidate 2
1223 -------------------------------
1224
1225 *(Released Fri, 27 Mar 2009)*
1226
1227 - Now the cfgupgrade scripts works and can upgrade 1.2.7 clusters to 2.0
1228 - Fix watcher startup sequence, improves the behaviour of busy clusters
1229 - Some other fixes in ``gnt-cluster verify``, ``gnt-instance
1230   replace-disks``, ``gnt-instance add``, ``gnt-cluster queue``, KVM VNC
1231   bind address and other places
1232 - Some documentation fixes and updates
1233
1234
1235 Version 2.0 release candidate 1
1236 -------------------------------
1237
1238 *(Released Mon, 2 Mar 2009)*
1239
1240 - More documentation updates, now all docs should be more-or-less
1241   up-to-date
1242 - A couple of small fixes (mixed hypervisor clusters, offline nodes,
1243   etc.)
1244 - Added a customizable HV_KERNEL_ARGS hypervisor parameter (for Xen PVM
1245   and KVM)
1246 - Fix an issue related to $libdir/run/ganeti and cluster creation
1247
1248
1249 Version 2.0 beta 2
1250 ------------------
1251
1252 *(Released Thu, 19 Feb 2009)*
1253
1254 - Xen PVM and KVM have switched the default value for the instance root
1255   disk to the first partition on the first drive, instead of the whole
1256   drive; this means that the OS installation scripts must be changed
1257   accordingly
1258 - Man pages have been updated
1259 - RAPI has been switched by default to HTTPS, and the exported functions
1260   should all work correctly
1261 - RAPI v1 has been removed
1262 - Many improvements to the KVM hypervisor
1263 - Block device errors are now better reported
1264 - Many other bugfixes and small improvements
1265
1266
1267 Version 2.0 beta 1
1268 ------------------
1269
1270 *(Released Mon, 26 Jan 2009)*
1271
1272 - Version 2 is a general rewrite of the code and therefore the
1273   differences are too many to list, see the design document for 2.0 in
1274   the ``doc/`` subdirectory for more details
1275 - In this beta version there is not yet a migration path from 1.2 (there
1276   will be one in the final 2.0 release)
1277 - A few significant changes are:
1278
1279   - all commands are executed by a daemon (``ganeti-masterd``) and the
1280     various ``gnt-*`` commands are just front-ends to it
1281   - all the commands are entered into, and executed from a job queue,
1282     see the ``gnt-job(8)`` manpage
1283   - the RAPI daemon supports read-write operations, secured by basic
1284     HTTP authentication on top of HTTPS
1285   - DRBD version 0.7 support has been removed, DRBD 8 is the only
1286     supported version (when migrating from Ganeti 1.2 to 2.0, you need
1287     to migrate to DRBD 8 first while still running Ganeti 1.2)
1288   - DRBD devices are using statically allocated minor numbers, which
1289     will be assigned to existing instances during the migration process
1290   - there is support for both Xen PVM and Xen HVM instances running on
1291     the same cluster
1292   - KVM virtualization is supported too
1293   - file-based storage has been implemented, which means that it is
1294     possible to run the cluster without LVM and DRBD storage, for
1295     example using a shared filesystem exported from shared storage (and
1296     still have live migration)
1297
1298
1299 Version 1.2.7
1300 -------------
1301
1302 *(Released Tue, 13 Jan 2009)*
1303
1304 - Change the default reboot type in ``gnt-instance reboot`` to "hard"
1305 - Reuse the old instance mac address by default on instance import, if
1306   the instance name is the same.
1307 - Handle situations in which the node info rpc returns incomplete
1308   results (issue 46)
1309 - Add checks for tcp/udp ports collisions in ``gnt-cluster verify``
1310 - Improved version of batcher:
1311
1312   - state file support
1313   - instance mac address support
1314   - support for HVM clusters/instances
1315
1316 - Add an option to show the number of cpu sockets and nodes in
1317   ``gnt-node list``
1318 - Support OSes that handle more than one version of the OS api (but do
1319   not change the current API in any other way)
1320 - Fix ``gnt-node migrate``
1321 - ``gnt-debug`` man page
1322 - Fixes various more typos and small issues
1323 - Increase disk resync maximum speed to 60MB/s (from 30MB/s)
1324
1325
1326 Version 1.2.6
1327 -------------
1328
1329 *(Released Wed, 24 Sep 2008)*
1330
1331 - new ``--hvm-nic-type`` and ``--hvm-disk-type`` flags to control the
1332   type of disk exported to fully virtualized instances.
1333 - provide access to the serial console of HVM instances
1334 - instance auto_balance flag, set by default. If turned off it will
1335   avoid warnings on cluster verify if there is not enough memory to fail
1336   over an instance. in the future it will prevent automatically failing
1337   it over when we will support that.
1338 - batcher tool for instance creation, see ``tools/README.batcher``
1339 - ``gnt-instance reinstall --select-os`` to interactively select a new
1340   operating system when reinstalling an instance.
1341 - when changing the memory amount on instance modify a check has been
1342   added that the instance will be able to start. also warnings are
1343   emitted if the instance will not be able to fail over, if auto_balance
1344   is true.
1345 - documentation fixes
1346 - sync fields between ``gnt-instance list/modify/add/import``
1347 - fix a race condition in drbd when the sync speed was set after giving
1348   the device a remote peer.
1349
1350
1351 Version 1.2.5
1352 -------------
1353
1354 *(Released Tue, 22 Jul 2008)*
1355
1356 - note: the allowed size and number of tags per object were reduced
1357 - fix a bug in ``gnt-cluster verify`` with inconsistent volume groups
1358 - fixed twisted 8.x compatibility
1359 - fixed ``gnt-instance replace-disks`` with iallocator
1360 - add TCP keepalives on twisted connections to detect restarted nodes
1361 - disk increase support, see ``gnt-instance grow-disk``
1362 - implement bulk node/instance query for RAPI
1363 - add tags in node/instance listing (optional)
1364 - experimental migration (and live migration) support, read the man page
1365   for ``gnt-instance migrate``
1366 - the ``ganeti-watcher`` logs are now timestamped, and the watcher also
1367   has some small improvements in handling its state file
1368
1369
1370 Version 1.2.4
1371 -------------
1372
1373 *(Released Fri, 13 Jun 2008)*
1374
1375 - Experimental readonly, REST-based remote API implementation;
1376   automatically started on master node, TCP port 5080, if enabled by
1377   ``--enable-rapi`` parameter to configure script.
1378 - Instance allocator support. Add and import instance accept a
1379   ``--iallocator`` parameter, and call that instance allocator to decide
1380   which node to use for the instance. The iallocator document describes
1381   what's expected from an allocator script.
1382 - ``gnt-cluster verify`` N+1 memory redundancy checks: Unless passed the
1383   ``--no-nplus1-mem`` option ``gnt-cluster verify`` now checks that if a
1384   node is lost there is still enough memory to fail over the instances
1385   that reside on it.
1386 - ``gnt-cluster verify`` hooks: it is now possible to add post-hooks to
1387   ``gnt-cluster verify``, to check for site-specific compliance. All the
1388   hooks will run, and their output, if any, will be displayed. Any
1389   failing hook will make the verification return an error value.
1390 - ``gnt-cluster verify`` now checks that its peers are reachable on the
1391   primary and secondary interfaces
1392 - ``gnt-node add`` now supports the ``--readd`` option, to readd a node
1393   that is still declared as part of the cluster and has failed.
1394 - ``gnt-* list`` commands now accept a new ``-o +field`` way of
1395   specifying output fields, that just adds the chosen fields to the
1396   default ones.
1397 - ``gnt-backup`` now has a new ``remove`` command to delete an existing
1398   export from the filesystem.
1399 - New per-instance parameters hvm_acpi, hvm_pae and hvm_cdrom_image_path
1400   have been added. Using them you can enable/disable acpi and pae
1401   support, and specify a path for a cd image to be exported to the
1402   instance. These parameters as the name suggest only work on HVM
1403   clusters.
1404 - When upgrading an HVM cluster to Ganeti 1.2.4, the values for ACPI and
1405   PAE support will be set to the previously hardcoded values, but the
1406   (previously hardcoded) path to the CDROM ISO image will be unset and
1407   if required, needs to be set manually with ``gnt-instance modify``
1408   after the upgrade.
1409 - The address to which an instance's VNC console is bound is now
1410   selectable per-instance, rather than being cluster wide. Of course
1411   this only applies to instances controlled via VNC, so currently just
1412   applies to HVM clusters.
1413
1414
1415 Version 1.2.3
1416 -------------
1417
1418 *(Released Mon, 18 Feb 2008)*
1419
1420 - more tweaks to the disk activation code (especially helpful for DRBD)
1421 - change the default ``gnt-instance list`` output format, now there is
1422   one combined status field (see the manpage for the exact values this
1423   field will have)
1424 - some more fixes for the mac export to hooks change
1425 - make Ganeti not break with DRBD 8.2.x (which changed the version
1426   format in ``/proc/drbd``) (issue 24)
1427 - add an upgrade tool from "remote_raid1" disk template to "drbd" disk
1428   template, allowing migration from DRBD0.7+MD to DRBD8
1429
1430
1431 Version 1.2.2
1432 -------------
1433
1434 *(Released Wed, 30 Jan 2008)*
1435
1436 - fix ``gnt-instance modify`` breakage introduced in 1.2.1 with the HVM
1437   support (issue 23)
1438 - add command aliases infrastructure and a few aliases
1439 - allow listing of VCPUs in the ``gnt-instance list`` and improve the
1440   man pages and the ``--help`` option of ``gnt-node
1441   list``/``gnt-instance list``
1442 - fix ``gnt-backup list`` with down nodes (issue 21)
1443 - change the tools location (move from $pkgdatadir to $pkglibdir/tools)
1444 - fix the dist archive and add a check for including svn/git files in
1445   the future
1446 - some developer-related changes: improve the burnin and the QA suite,
1447   add an upload script for testing during development
1448
1449
1450 Version 1.2.1
1451 -------------
1452
1453 *(Released Wed, 16 Jan 2008)*
1454
1455 - experimental HVM support, read the install document, section
1456   "Initializing the cluster"
1457 - allow for the PVM hypervisor per-instance kernel and initrd paths
1458 - add a new command ``gnt-cluster verify-disks`` which uses a new
1459   algorithm to improve the reconnection of the DRBD pairs if the device
1460   on the secondary node has gone away
1461 - make logical volume code auto-activate LVs at disk activation time
1462 - slightly improve the speed of activating disks
1463 - allow specification of the MAC address at instance creation time, and
1464   changing it later via ``gnt-instance modify``
1465 - fix handling of external commands that generate lots of output on
1466   stderr
1467 - update documentation with regard to minimum version of DRBD8 supported
1468
1469
1470 Version 1.2.0
1471 -------------
1472
1473 *(Released Tue, 4 Dec 2007)*
1474
1475 - Log the ``xm create`` output to the node daemon log on failure (to
1476   help diagnosing the error)
1477 - In debug mode, log all external commands output if failed to the logs
1478 - Change parsing of lvm commands to ignore stderr
1479
1480
1481 Version 1.2b3
1482 -------------
1483
1484 *(Released Wed, 28 Nov 2007)*
1485
1486 - Another round of updates to the DRBD 8 code to deal with more failures
1487   in the replace secondary node operation
1488 - Some more logging of failures in disk operations (lvm, drbd)
1489 - A few documentation updates
1490 - QA updates
1491
1492
1493 Version 1.2b2
1494 -------------
1495
1496 *(Released Tue, 13 Nov 2007)*
1497
1498 - Change configuration file format from Python's Pickle to JSON.
1499   Upgrading is possible using the cfgupgrade utility.
1500 - Add support for DRBD 8.0 (new disk template ``drbd``) which allows for
1501   faster replace disks and is more stable (DRBD 8 has many improvements
1502   compared to DRBD 0.7)
1503 - Added command line tags support (see man pages for ``gnt-instance``,
1504   ``gnt-node``, ``gnt-cluster``)
1505 - Added instance rename support
1506 - Added multi-instance startup/shutdown
1507 - Added cluster rename support
1508 - Added ``gnt-node evacuate`` to simplify some node operations
1509 - Added instance reboot operation that can speedup reboot as compared to
1510   stop and start
1511 - Soften the requirement that hostnames are in FQDN format
1512 - The ``ganeti-watcher`` now activates drbd pairs after secondary node
1513   reboots
1514 - Removed dependency on debian's patched fping that uses the
1515   non-standard ``-S`` option
1516 - Now the OS definitions are searched for in multiple, configurable
1517   paths (easier for distros to package)
1518 - Some changes to the hooks infrastructure (especially the new
1519   post-configuration update hook)
1520 - Other small bugfixes
1521
1522 .. vim: set textwidth=72 syntax=rst :
1523 .. Local Variables:
1524 .. mode: rst
1525 .. fill-column: 72
1526 .. End: