Note de lecture : Delivering Business Intelligence with Microsoft SQL Server 2008, par Brian Larson

Note: 7 ; Une approche didactique, complète et progressive d’Analysis Services

Et encore un bon gros pave de 770 pages! Tout aussi effrayant que cela soit, j’ai en fait été surpris par l’aisance que j’ai eu à avaler les 19 chapitres de cet ouvrage. Il faut dire qu’ayant commencé par voir sur Amazon quel était le meilleur texte sur Analysis Services, je n’ai été qu’à moitié surpris. Je n’hésite pas à le dire, ce livre est un quasi parfait didacticiel, capable de remplacer une formation sur le sujet. Le contenu équilibre fort bien les aspects théoriques, la présentation des fonctionnalités SSAS et la mise en pratique par les « Learning by doing ».

La plus flagrante faiblesse que j’y vois concerne justement les « LBD » : j’ai trouvé les descriptions des mises en pratiques bien trop micro managées, à tel point qu’on finit par ne plus savoir ni comprendre ce que l’on fait ! C’est bien dommage, car par ailleurs ces exercices (et ils sont nombreux) ont des finalités tout à fait pertinentes.

Pour résumer, et avant d’en survoler le contenu, je dirais que ce livre recèle 2 gros points forts :

  • L’équilibre entre les explications théoriques sur les principes (qu’est-ce que le BI, qu’est-ce qu’UDM, quels sont les différents modèles OLAP, etc..), les explications sur la façon dont ils sont mis en œuvre dans SQL Server, et la mise en pratique concrète (les LBD dont nous avons parlé précédemment).
  • La couverture du sujet, qui ne se localise pas à Analysis Services sensu stricto, mais inclut la modélisation dimensionnelle (relationnelle), l’alimentation, la fabrication d’un Cube, l’analyse avec MDX et même le Data Mining et la mise en place de reports avec Reporting Services ou Excel et ses pivot tables !

Je ne vais pas rentrer dans le détail de la table des matières, ce serait trop fastidieux, mais simplement évoquer les 5 grandes parties du livre.

La première partie « Business Intelligence » couvre 5 chapitres totalisant 90 pages. L’objectif de cette partie est de mettre en place les concepts liés au BI : qu’est-ce que c’est ? Quand et pourquoi s’en sert-on ? Quels sont ces concepts liés au BI (data Mart, OLAP, UDM, etc..), à quoi ressemble une modélisation dimensionnelle ? Comment tout cela est-il architecturé dans le système ? Cette première partie se termine par une introduction à Visual studio qui sera abondamment utilisé par la suite.

La seconde partie « Defining business intelligence structures » est longue de 3 chapitres couvrant 200 pages ! Elle rentre dans le vif de la modélisation dimensionnelle et de sa mise en place dans une base relationnelle. Mais en fait, ce qui explique la taille de cette partie est la longue mise en pratique de SSIS. L’ETL Microsoft est par ailleurs le sujet de livres à part entière, mais j’avoue que les deux chapitres qui figurent ici n’ont pas à rougir avec certain d’entre eux ! Utilisant SSIS très régulièrement depuis 2 ans, j’y ai découvert des choses !

La troisième partie « Analysing cube content » avoue 170 pages découpé en 4 chapitres. Comme son nom l’indique, cette partie se consacre à l’exploitation du cube décisionnel. Mais avant de l’exploiter, il faut le construire ! On commence donc par concevoir le cube, avec ses dimensions et ses groupes de mesures, puis par le déployer. Une fois cela fait, on peut mettre en place des KPI, les relations de hiérarchie et autres agrégations. Et bien sûr, on termine par les opérations de navigation dans le cube, par SSMS ou via les requêtes MDX.

La quatrième partie se consacre au Data Mining, car SQL Server possède bel et bien des fonctions de data mining intégrées ! 90 pages organisées en 3 chapitres couvrent ce sujet. On débute bien entendu par une présentation de ce domaine et des différents algorithmes de data mining. Puis on pénètre réellement dans le sujet en construisant un « data mining model ». Le reste de cette partie est consacré à la mise en œuvre des différents algorithmes de data mining proposés par Microsoft.

La dernière partie « Delivering » s’étend sur 180 pages en 4 chapitres. Elle couvre la restitution d’information. Cette partie est surtout conséquente parce que l’auteur est par ailleurs un expert reconnu de Reporting Services (il est l’auteur d’un best seller sur le sujet). Donc Reporting Services couvre ici 3 chapitres, et plutôt de très bonne façon, reconnaissons-le, tandis que les Pivot Table sont réduites à la portion congrue, ce qui est un peu frustrant.

J’en ai terminé avec l’aspect descriptif. Voici maintenant mon conseil : Vous voulez vous mettre à SSAS ? C’est LE livre, ne le ratez pas.

delivering-bi-sqlserver2008

Référence complète : Delivering Business Intelligence with Microsoft SQL Server 2008 – Brian Larson – McGraw-Hill 2009 – ISBN: 978 0 07 154944 8

Delivering Business Intelligence with Microsoft SQL Server 2008


http://www.goodreads.com/book/add_to_books_widget_frame/0071549447?atmb_widget%5Bbutton%5D=atmb_widget_1.png&atmb_widget%5Bhide_friends%5D=on

Publicité

Note de lecture : SQL Server Hardware par Glenn Berry

Note : 5 ; Passionnant et frustrant tout à la fois

Voilà un livre tout à fait original, mais combien important. Il est en effet peu réaliste d’effectuer un déploiement optimisé de base de données sans prendre en considération l’aspect matériel. Et là on est souvent obligé de se débrouiller avec des informations glanées à droite ou à gauche.

Tout d’abord la taille du livre : s’il compte 320 pages, il faut prendre en considération la taille de la police de caractères qui est très grande. Je dirais qu’au final on est plus proche d’un livre classique de 200 pages environs.

Pourquoi ai-je trouvé ce livre passionnant ? Il est éclairant sur de nombreux points : décodage des roadmaps processeurs, choix des architectures machine multi-core, stockage RAID, SAN et SSD et pas mal de choses encore. On y évoque des points de configuration tout à fait pertinents : réglage énergétique, hyper threading, filegroups, etc.. De plus l’auteur prend de réelles positions par rapport à ces choix et c’est bien ce que j’attend d’un ouvrage.

Pourquoi l’ai-je trouvé décevant ? Tout d’abord j’ai trouvé le texte hors sujet sur le détail des fonctionnalités des différentes éditions et versions de SQL Server. On est loin du hardware et ce genre d’information traine ailleurs. Le dernier chapitre sur l’installation et la configuration ressemble carrément à du remplissage et je reste mitigé sur le chapitre concernant le système d’exploitation. D’un autre côté, si les chapitres purement destinés u matériel sont riches d’information, j’aurais aimé une étude plus approfondie du fonctionnement comparé de SQL OS versus l’hyper threading ou la virtualisation (voir même les deux). Le fonctionnement de la lecture/écriture de blocs avec le fonctionnement d’un SAN ou du SSD, les impacts sur l’utilisation en I/O d’un iSCSI ou d’un fiber channel, idem pour l’alignement des partitions.

Bref, si l’on a un point de vue « utilisateur » d’un DBA très averti sur les aspects matériels d’un SQL Server, il manque de mon point de vue une analyse en profondeur de ces aspects pour en saisir toutes les susceptibilités.

Au final, voici un livre qui aurait pu être mieux, bien mieux ! Mais il se lit bien et même très vite, et donne beaucoup d’indications et d’informations pour réussir son choix matériel et la configuration d’une machine SQL Server. N’est-ce pas l’essentiel ? Et ne serait-ce que pour cela, j’en recommande la lecture.

sql-server-hardware

Référence complète : SQL Server Hardware – Glenn Berry – Simple Talk Publishing 2011 – ISBN : 978 1 906434 63 2

SQL Server Hardware


http://www.goodreads.com/book/add_to_books_widget_frame/1906434638?atmb_widget%5Bbutton%5D=atmb_widget_1.png&atmb_widget%5Bhide_friends%5D=on

Note de lecture : Optimiser SQL Server, par Rudi Bruchez

Note: 7 ; Pratiquement une révélation !

Utiliser efficacement une base de données telle que SQL Server 2005 nécessite d’une par une compréhension fine de son mode de fonctionnement et de ses structures de données, mais également une connaissance des outils mis à disposition. Livrés en vrac, cet ensemble est presqu’inutile car il faut être guidé au sein de cette pléthore.

Le livre de Rudi Bruchez nous livre incontestablement les clés adéquates. L’auteur est clairement très qualifié pour aborder le sujet et il aborde à la fois la base de données et ses outils en nous gratifiant de liens vitaux pour explorer les sujets plus en profondeur. Je dois dire que nous devons nous estimer satisfaits qu’un ouvrage de bonne teneur soit écrit, en français, c’est rare ! Il ne faudra pas non plus s’attendre à une lecture captivante, le style reste technique, mais abordable la plupart du temps (j’ai toutefois décollé de temps à autre, je l’avoue…).

Le contenu du livre est découpé « à la française », c’est-à-dire avec des chapitres assez gros : les 312 pages de l’ouvrage sont découpés en 9 chapitres seulement. Mais on a vu pire.

Après un premier chapitre purement introductif, le chapitre 2 aborde l’architecture de SQL Server. Ce n’est pas une montée en puissance graduelle, car ce chapitre est le plus difficile de l’ouvrage !

Lire la suite

Note de lecture : Découvrir Microsoft SQL Server 2005, par Peter DeBetta

Note : 3 ; Un texte introductif qui déçoit en ratant un peu son sujet

De nouveau une note de lecture un peu ancienne, qui traite d’une version “n – 2” de SQL Server. Je la fais figurer ici par nostalgie …

Lorsque j’ai ouvert ce livre, je n’imaginais pas qu’il fut destiné au lecteur déjà aguerri aux versions précédentes de SQL server et déjà largement initié à l’environnement .NET (pour ne pas parler de Windows server…). Pourtant tout commençait bien, car cet opuscule de 200 pages semblait traiter les différents sous-ensembles de ce SGBD tentaculaire. En fait, les problèmes commencent avec la traduction du titre qui omet le « for developers ». Ceci explique certainement cela…

Les deux premiers chapitres (soit 35 pages) traitent des nouveautés de Transact SQL. Là c’est simple : si vous n’êtes pas un vieux routier du dialecte de Microsoft, le propos est incompréhensible. C’est mon cas. Donc, la suite.

Le chapitre 3 met tout de suite d’avantage l’eau à la bouche. Les possibilités de SQL server vis-à-vis de XML donnent envie d’en savoir plus. C’est cde que j’attends d’un ouvrage introductif. Dommage que les exemples soient (c’est un problème récurent du livre) trop touffu pour ce type de livre. Il est même amusant, sur le seul exemple dépouillé vraiment adapté au texte, de voir l’auteur s’excuser de la simplicité de l’exemple.

La seconde partie, qui pèse 4 chapitres et 80 pages traite de l’intégration CLR. Il était difficile de ne pas traiter le sujet. Là encore, l’auteur se trompe dans la profondeur de traitement du sujet. Mais globalement, on arrive à comprendre comment s’articule le code .NET au sein de SQL server. Dommage que la cinématique globale soit traité de façon si peu claire.

La troisième partie est certainement la plus intéressante, car elle traite des services annexes réellement novateurs de SQL server 2005. Nonobstant le problème récurent des exemples, les différents chapitres donnent vraiment envie d’en savoir plus :

  • Les DTS ne sont pas traités de la façon la plus claire qui soit. Hélas aussi, comme ce livre a été écrit sur la base d’une version bêta de SQL server 2005, il n’intègre pas la substitution de DTS par SSIS ! À revoir, donc… Autre problème récurent de cette troisième partie, on a du mal à comprendre ce qui est géré au sein de SQL server, par du T-SQL ou du code.NET embarqué ou ce qui est géré par une application externe appelant SQL server !
  • Les objets SMO sont clairement abordés, mais auraient probablement du être traité en partie 2.
  • Le support SOAP est traité de façon claire et succincte. Dommage qu’il ait été abandonné dans les versions ultérieures…
  • Les chapitres consacrés au service de notification et au service Broker ne sont pas parfaits, mais traitent quand même leur sujet.
  • Le service de reporting aurait pu être traité plus succinctement sur l’aspect structuration des reports et aborder l’Analysis service en contrepartie.

Globalement, je suis déçu. Déjà, ce livre anticipé est devenu obsolète bien trop vite. D’autre part, il n’est pas à la hauteur des autres livres introductifs de Microsoft press. C’est dommage, car un sujet aussi large que SQL server nécessite absolument ce type de texte pour le nouveau venu.

decouvrir-sqlserver2005

Référence complète : Découvrir Microsoft SQL Server 2005 – Peter DeBetta – Microsoft press 2005 (V.O. : Introducing Microsoft SQL Server 2005 for developers) – ISBN : 2-10-048896-1 (V.O. : 0-7356-1962-X)

Découvrir Microsoft SQL Server 2005


http://www.goodreads.com/book/add_to_books_widget_frame/2100488961?atmb_widget%5Bbutton%5D=atmb_widget_1.png&atmb_widget%5Bhide_friends%5D=on

Note de lecture : Beginning SQL Server 2005 for Developpers, par Robin Dewson

Note: 7 ; LE livre pour bien débuter avec SQL Server 2005

Attaquer une « grosse » base telle que SQL Server 2005 quand on n’a pas l’expérience de tels environnements n’est pas évident. Paramétrage, gestion des bases, exploitation et administration sont autant de sujets à découvrir autant sous l’aspect du « quoi » que sous l’aspect du « comment ». Ce livre répond parfaitement à cet objectif. En tout cas, il a bien marché pour moi. Il fait un tour d’horizon complet de la base de données en introduisant chacune de ses facettes, en expliquant par l’exemple comment faire, aussi bien avec les outils interactifs qu’avec le T-SQL. Bref, on est mieux armé à la sortie, et l’on sait dans quelle direction aller sur chacun des sujets, prêt à approfondir plus avant chaque sujet dont on a le besoin.

Les deux premiers chapitres présentent l’architecture de la base, ses options d’installation et le « management studio » qui est l’outil interactif permettant d’accéder à la plupart des fonctionnalités de la base.

Le chapitre trois nous guide pour ce qui est de la création des bases, les différentes options possibles et donne des clés pour configurer une base optimale en termes de performances.

Le chapitre 4 est consacré à la sécurité et à la gestion des utilisateurs. Il présente clairement les différents modes d’authentification et donne des conseils pragmatiques quand aux configurations à adopter, surtout pour les bases d’exploitation. Un sujet habituellement aride, traité ici avec pragmatisme et intelligence.

Les chapitres 5 et 6 sont dédiés au design des bases : création de tables et d’index. Là encore, on a une information détaillée et précieuse, même si le chapitre 6 ne s’avère pas si clair que ça.

Le chapitre 7 est consacré à l’administration : les procédures de backup et de maintenance. On y trouve juste ce dont on a besoin : Les clés pour assurer la mise en place de procédure de gestion classiques de sauvegarde et de maintenance. Indispensable !

Avec les chapitres 8 à 13, on aborde le gros de la troupe : travailler avec T-SQL. Même si le langage a été abordé avant pour la mise en œuvre des différentes fonctions dans ce langage, c’est de manipulation de données dont il est question ici ! Le chapitre 8 nous donne le bagage de base pour traiter les données : select, update et delete avec les différentes clauses de base. Le chapitre 9 traite d’un sujet plus pointu : les vues. Hélas ce n’est pas le meilleur chapitre du livre. Les procédures stockées (comment y échapper ?) sont couvertes par le chapitre 10. Même s’il manque pas mal de briques pour faire tout ce que l’on souhaiterait, on a de quoi démarrer. Les chapitres 11 et 12 terminent le tour d’horizon du T-SQL d’abord en le balayant en largeur, puis en abordant les aspects moins usités du langage. J’avoue avoir largement décroché au chapitre 12 (et aussi un peu au chapitre 11). Le chapitre 13 clos l’affaire avec les triggers et des conseils fort pertinents quand à leur usage.

Un peu en décalage, le chapitre 14 aborde Reporting Service. Il nous permet de désirer en savoir plus, car le traitement qui en est fait ici est vraiment superficiel.

Bref, voilà un ouvrage qui, en 400 pages, nous permet d’avoir une vue globale de l’outil, et m’a permis de porter mon attention sur ce qui était mal fait ou pas fait sur la façon dont nous l’utilisions. Sous cet angle, il a déjà dix fois justifié son achat, et je sais qu’il continuera encore à me rendre service.

Le problème inhérent aux livres liés à des technologies particulères est qu’il vieillissent à la vitesse de celles-ci. Cet ouvrage a déjà connu deux mises à jour, pour SQL Server 2008 puis SQL Server 2012 (que je n’utilise pas encore). La troisième édition a d’ailleurs enflé jusqu’à 700 pages ! Cela voudra certainement dire une petite mise à jour dans un avenir certainement pas trop lointain.

beginning-sqlserver2005-dev-apress

Référence complète : Beginning SQL Server 2005 for Developpers, from novice to professional – Robin Dewson – Apress 2006 – ISBN : 1-59059-588-2 ; EAN : 978 1 59059 588 6

Beginning SQL Server 2005 for Developers: From Novice to Professional


http://www.goodreads.com/book/add_to_books_widget_frame/1590595882?atmb_widget%5Bbutton%5D=atmb_widget_1.png&atmb_widget%5Bhide_friends%5D=on