Depuis quelques jours, le système de réservation et d'achat de billets de la SNCF ne marche plus. Cette architecture, conçue par la SSII Cap Gemini, se base sur des technologies MicroSoft© Windows™. Cet article [FR], et surtout celui-ci [FR] sur libération.fr nous en apprend un peu plus sur la mise en place du système, baptisé Mosaïque.
Depuis trois mois, le système Mosaïque a été quasi généralisé à toutes les gares, dont celles de Paris, raconte Didier Fontaine, secrétaire fédéral de Sud Rail. Jusqu'à présent, on avait eu quelques petites pannes par-ci, par-là, trois ou quatre par jour mais qui ne durait pas longtemps. Il suffisait de rebooter. Là, c'est la panne nationale. Il y a vraiment des problèmes de fiabilité de ce nouveau système
Rebooter un serveur (ou bien même un poste client) 3 ou 4 fois par jour, normal? 'sont forts quand même chez Cap Gemini Ernst et Young pour laisser penser à la SNCF (la citation ci dessus est d'un représentant syndical, donc informé sur le système par sa direction, ou par la communication interne de celle ci j'imagine) qu'un dysfonctionnement entrainant 3 ou 4 relance d'une machine par jour est un fonctionnement suffisamment stable pour justifier le passage en production, voir normal ou bien anecdotique. Cela me fait penser aux utilisateurs du système d'exploitation de MiniMou, qui estiment que le redémarrage de leur poste de travail tient du fonctionnement normal et prévu de leur ordinateur (si si, il y en a), c'est un peu comme si un cycliste sur le tour de France dont la chaine sauterait tous les 2 kilomètres disait que c'est un comportement tout à fait normal, de nature à améliorer ses performances.
Ce communiqué de Sud Rail [FR], 2ième plus important syndicat de la SNCF, nous apprend par ailleurs que le problème est survenu suite à une mise à jour du système intervenu entre le 14 et le 15 juillet, date à laquelle différentes mises à jour du système d'exploitation de MicroSoft© ont justement eu lieu (4 ou 5 rustines depuis le 13 juillet). Peut-on incriminer celles ci, ou bien Windows Update™? Comme quoi, une mise à jour ça ne se fait pas à la légère (attention, je ne dis pas que c'est le cas ici, je constate juste une coincidence temporelle). A moins que la mise à jour n'ai concernée l'applicatif de Cap Gemini (d'expérience professionnelle, dans 95 pourcents des cas, le problème est applicatif), auquel cas le correctif devrait pouvoir se trouver rapidement, mais le problème semble perdurer à l'heure actuelle.
Bon sang, une machine doit pouvoir obtenir un uptime conséquent, et ne pas subir de redémarrage systématique régulier, c'est un comportement tout ce qu'il y a de plus erratique. Quelle que soit la source de cette instabilité, elle n'est pas justifiable.