Note de lecture : Monitoring Taxonomy, par Dave Josephsen

Note : 3 ; Plutôt qu’un livre, un catalogue pour éveiller votre curiosité.

Le monde du monitoring est plus complexe qu’il n’y parait de prime abord. Non seulement il adresse des finalités très différentes allant des ressources systèmes, infrastructure et réseau jusqu’à l’expérience utilisateur, mais il prend en compte des aspects et des fonctionnalités variés : indicateurs, évènements, découvertes de services, tableau de bord et reporting, pour citer les principaux.

L’objectif de court opuscule d’une soixantaine de pages est d’organiser ce paysage en proposant une taxonomie (d’où le titre) où l’auteur va classer les outils de marché. Bref il s’agit d’un catalogue. Pour être précis, il s’agit de la mise en forme rédigée d’un catalogue disponible et mis à jour sur GitHub. Cela explique d’une part le côté un peu rugueux du texte sur lequel je reviendrais et le fait que ce catalogue soit promis à l’obsolescence. Hélas pas de mise à jour publiée ni en vue à ce jour, pour ce texte.

L’explication de la taxonomie, c’est le sujet du premier chapitre qui tente de l’expliquer en 6 pages. Il utilise 3 axes de classification que je ne développerais pas ici, mais qu’il est bien difficile de comprendre (à part l’axe « modèle de pricing » qui est classique) quand on débarque juste de sa campagne et que l’on n’est pas bien au fait du domaine du monitoring. Car en fait le texte est bel et bien fait pour ceux qui nagent déjà dedans. Rugueux, je vous dis.

Au second chapitre, sobrement intitulé « monitoring » est clairement le plus intéressant de tous. Il cherche à brosser une explication du paysage du monitoring. Là encore, il faut bien s’accrocher aux explications souvent avares et peu soucieuses du nouveau venu. Toutefois, il permet de saisir des choses sur les différentes finalités, les différentes architectures et mode de fonctionnement de tous ces outils.

Les huit chapitres suivants constituent le catalogue proprement dit. Les chapitres 3 et 4 ouvrent le bal avec les collecteurs, data et système, respectivement. Ces deux chapitres ne couvrent chacun qu’un seul outil (Statd et Collectd). Le lecteur est sensé les connaitre au moins un peu, ce qui n’est pas mon cas. J’ai bien du mal à comprendre s’il s’agit d’outils qui collectent les métriques sur les serveurs ou qui les centralisent. Des diagrammes auraient permis d’en comprendre l’architecture. Mais, il faut faire sans, c’est un peu dur. Chaque outil est décrit par un ensemble de sections, toujours les mêmes, que l’on retrouvera dans les chapitres suivants : push/pull, résolution de mesure (fréquence), stockage, capacité d’analyse, capacité de notification, capacité d’intégration, modèle de scalabilité.

Les chapitres 5, 6 et 7 traitent de ce qu’il est convenu d’appeler les « monolithes ». Ils adressent : les données, le réseau et le système, dans cet ordre. Le chapitre 6 va couvrir 3 poids lourds : ELK, Consul et Prometheus. De mon point de vue, le positionnement de chacun d’entre eux est assez différent. Cela me rend difficile la compréhension de ce qu’est réellement cette catégorie. Côté réseau, on se contentera de SmokePing, un outil dont j’ignorais même l’existence. Au moins maintenant, je sais qu’il existe. Le chapitre 7 est celui qui regroupe le plus grand nombre d’outils. Outre Ganglia, on y retrouve Nagios et la pléthore d’outils qui se veulent en être la seconde génération. Si vous connaissez Nagios, vous savez ce que regroupe cette catégorie. Note to myself : en savoir plus sur Nagios.

Les 3 derniers chapitres couvrent les « processeurs », les outils qui consomment les évènements de monitoring à diverses fins, mais essentiellement pour l’analyse. Là encore le triptyque est : données, réseau et système, dans cet ordre. Dans la catégorie « donnée » abordée au chapitre 8, on trouve sans surprise les poids lourds que sont Grafana et Graphite, même si leur scope est assez différent (le chapitre 6 présente Prometheus comme un Graphite réinventé, pourtant ils sont dans deux catégories différentes…). OpenTSDB est moins connu et est un peu la version poids lourd de l’analyse à base de Hadoop et map-reduce. Côté réseau, cette section se résume à Cacti qui est décrit comme un pller centralisé, ce qui devrait plutôt le faire figurer chez les monolithes ? Mais encore une fois, je ne maitrise pas très bien la classification. Enfin côté système, là aussi un seul outil : Riemann. Il s’agit d’un système d’analyse basé sur une chaine de streaming où l’on « plug » des filtres, des analyses, etc. Il semble plutôt assez général, pourquoi donc l’avoir localisé au « système » ? De plus il me semble aussi loin d’être « traditional », au contraire. Mais la description, même succincte me donne l’envie d’en savoir plus.

L’ouvrage est court, je l’ai dit. Il s’adresse aux sachants du domaine qui ont envie d’avoir un bon panorama de l’écosystème. C’est dommage. Il mériterait d’être plus développé dans ses présentations et ses explications, mieux illustré aussi. Cela doublerait la taille du livre, peut-être plus, mais le positionnement de ce texte le mérite. Et une mise à jour tous les 3 ans en feraient vite un ouvrage de référence. Pour l’instant, on en est plutôt loin.

Référence complète : Monitoring Taxonomy – Dave Josephsen – O’Reilly 2017 – ISBN : 978 1 491 95083 8

Votre commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l’aide de votre compte WordPress.com. Déconnexion /  Changer )

Image Twitter

Vous commentez à l’aide de votre compte Twitter. Déconnexion /  Changer )

Photo Facebook

Vous commentez à l’aide de votre compte Facebook. Déconnexion /  Changer )

Connexion à %s

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur la façon dont les données de vos commentaires sont traitées.