L’architecture de Von Neumann

“First draft of a Report on the EDVAC”, c’est ainsi que l’histoire gardera trace de la publication qui définira l’architecture des ordinateurs pour (au moins) les 70 années suivantes !

Une paternité contestée…

Il en va hélas souvent ainsi des contributions majeures. Ce papier a été publié le 30 Juin 1945. Ce travail est l’émergence des réflexions du mathématicien, sans aucun doute après avoir travail sur ENIAC d’une part, et sur le Mark I d’autre part. C’est sans doute la raison pour laquelle Eckler et Mauchly contestent l’originalité des idées de Von Neumann, alors même que l’ENIAC n’était pas réellement un ordinateur programmable, mais plutôt recevable.

De l’autre côté, il semble qu’Howard Aiken, le père du Mark I qui lui était bien programmable n’ait jamais pris de position de controverse !

L’article

Je pense pour ma part qu’il faut rendre à Cesar ce qui est à César. Certes, Von Neumann n’a pas tout inventé, mais Eckler et Mauchly d’une part et Aiken de l’autre ce sont aussi inspirés de prédécesseurs : Vannevar Bush et même avant cela Babbage !

L’article que je met à disposition ici n’est pas l’original, mais une reproduction fidèle, le texte étant lui l’original, avec une mise en page aussi fidèle que possible à l’originale. L’IEEE est à l’origine de cette reproduction faite en 1993.

Publicité

Note de lecture : Storage Virtualization, par Tom Clark

Note : 6 ; Vue aérienne de la virtualisation du stockage

Tom Clarke est un des gourous du SAN, il a déjà plusieurs livres sur le sujet à son actif. Celui-ci est le plus récent, ce qui tombe bien car le sujet évolue à toute vitesse ! Ce livre a une vocation introductive sur le sujet, ce qui tombe bien en ce qui me concerne. La taille tout à fait raisonnable de l’ouvrage (175 pages hors annexes) appuie encore ce point. J’ai d’autant apprécié que le texte soit découpé en 14 chapitres, chacun taillant de 10 à 15 pages. Chaque chapitre aborde un thème particulier de ce sujet, je n’aurais pas imaginé qu’il y en autant ! Malgré cela il reste conseillé de lire ces chapitres dans l’ordre, car ils suivent une progression logique.

Les 3 premiers chapitres posent les bases : fichiers, enregistrements, données et structures RAID. En fait, bien que l’auteur pose clairement les différents concepts, il y a peu de nouveautés.

Cela change avec les chapitres 4 à 8 qui détaillent les principes de la virtualisation : au niveau des serveurs source, au niveau des baies de disque ou au niveau du réseau. Ce milieu de livre constitue véritablement la clé de l’ouvrage et présente les concepts importants. La virtualisation au niveau du réseau étant pour moi la véritable découverte.

La fin du livre présente les différentes facettes « externes » de la virtualisation : périphériques, services ou archivage. Ils complètent utilement la description du paysage.

Un aspect important du livre est la taille et la qualité des annexes. Au sein de celles-ci on notera l’annexe C qui collecte les observations d’intervenants impliqués dans ce domaine.

J’ai apprécié ce livre, suffisamment haut niveau pour un nouveau venu comme moi. Je reste malgré tout un peu frustré par le manque de concret de ce livre introductif. Il est bien difficile d’imaginer une architecture sur la base de l’information distillée ici. Il faudra pour cela se rabattre sur le best seller de Tom Clarke, mais celui-ci date quand même de 7 ans…

storage-virtualization

Référence complète : Storage Virtualization, technologies for simplifying data storage and management – Tom Clark – Addison Wesley 2005 – ISBN : 0-321-26251-4 ; EAN : 9 780321 262516

Storage Virtualization: Technologies for Simplifying Data Storage and Management


http://www.goodreads.com/book/add_to_books_widget_frame/0321262514?atmb_widget%5Bbutton%5D=atmb_widget_1.png&atmb_widget%5Bhide_friends%5D=on

Note de lecture : SQL Server Hardware par Glenn Berry

Note : 5 ; Passionnant et frustrant tout à la fois

Voilà un livre tout à fait original, mais combien important. Il est en effet peu réaliste d’effectuer un déploiement optimisé de base de données sans prendre en considération l’aspect matériel. Et là on est souvent obligé de se débrouiller avec des informations glanées à droite ou à gauche.

Tout d’abord la taille du livre : s’il compte 320 pages, il faut prendre en considération la taille de la police de caractères qui est très grande. Je dirais qu’au final on est plus proche d’un livre classique de 200 pages environs.

Pourquoi ai-je trouvé ce livre passionnant ? Il est éclairant sur de nombreux points : décodage des roadmaps processeurs, choix des architectures machine multi-core, stockage RAID, SAN et SSD et pas mal de choses encore. On y évoque des points de configuration tout à fait pertinents : réglage énergétique, hyper threading, filegroups, etc.. De plus l’auteur prend de réelles positions par rapport à ces choix et c’est bien ce que j’attend d’un ouvrage.

Pourquoi l’ai-je trouvé décevant ? Tout d’abord j’ai trouvé le texte hors sujet sur le détail des fonctionnalités des différentes éditions et versions de SQL Server. On est loin du hardware et ce genre d’information traine ailleurs. Le dernier chapitre sur l’installation et la configuration ressemble carrément à du remplissage et je reste mitigé sur le chapitre concernant le système d’exploitation. D’un autre côté, si les chapitres purement destinés u matériel sont riches d’information, j’aurais aimé une étude plus approfondie du fonctionnement comparé de SQL OS versus l’hyper threading ou la virtualisation (voir même les deux). Le fonctionnement de la lecture/écriture de blocs avec le fonctionnement d’un SAN ou du SSD, les impacts sur l’utilisation en I/O d’un iSCSI ou d’un fiber channel, idem pour l’alignement des partitions.

Bref, si l’on a un point de vue « utilisateur » d’un DBA très averti sur les aspects matériels d’un SQL Server, il manque de mon point de vue une analyse en profondeur de ces aspects pour en saisir toutes les susceptibilités.

Au final, voici un livre qui aurait pu être mieux, bien mieux ! Mais il se lit bien et même très vite, et donne beaucoup d’indications et d’informations pour réussir son choix matériel et la configuration d’une machine SQL Server. N’est-ce pas l’essentiel ? Et ne serait-ce que pour cela, j’en recommande la lecture.

sql-server-hardware

Référence complète : SQL Server Hardware – Glenn Berry – Simple Talk Publishing 2011 – ISBN : 978 1 906434 63 2

SQL Server Hardware


http://www.goodreads.com/book/add_to_books_widget_frame/1906434638?atmb_widget%5Bbutton%5D=atmb_widget_1.png&atmb_widget%5Bhide_friends%5D=on

Note de lecture : Using SANs and NAS, par W. Curtis Preston

Note : 7 ; Le stockage réseau vu par Mr backup !

Comme je viens de le dire plus haut, Curtis Preston est surtout connu en tant qu’expert du backup. Il nous livre ici un ouvrage pour démystifier les SANs et NAS. Et franchement, il fait bien son travail. Tout d’abord la taille du livre limitée à 190 pages (hors annexes), elles-mêmes largement émaillées d’illustrations permettent de ne pas êtres noyés dans la complexité du sujet et de rester clair. Pour rester dans les traits généraux de l’ouvrage, je dois dire que j’ai particulièrement apprécié le style très conversationnel de l’auteur, sa façon très directe et concise d’aborder problèmes et définitions et aussi, chose trop rare, ses prises de positions sur l’ensemble des sujets abordés. Curtis Preston n’hésite pas non plus à nous faire part de son expérience, mais celle-ci doit hélas être appréhendée avec un certain recul car le texte date hélas de 5 ans ! Il serait temps de publier une seconde édition… Parlons maintenant du contenu.

A une exception près (dont je reparlerais plus loin), les chapitres sont assez courts, de 15 à 25 pages : 3 sont consacrés au SAN et 3 sont dédiés au NAS, le premier chapitre est introductif, il met les deux technologies en perspectives et fait état de leurs mérites comparés. Croyez-moi, il permet à lui seul d’y voir plus clair.

Les chapitres 2 et 3, consacrés au SAN, sont respectivement consacrés à l’architecture fibre channel et à la gestion du SAN. Là encore le propos est un modèle de clarté. La pile protocolaire FC et les différents éléments matériels sont expliqués simplement mais précisément. De même toutes les fonctions de gestion (slicing, zoning, multi-pathing et load-balancing, etc…) sont passés en revue avec une remarquable efficacité.

J’en viens au chapitre 4, qui développe le backup au sein d’un SAN. C’est évident, c’est le sujet préféré de l’auteur. Le chapitre approche les 50 pages et contrairement au reste du livre, on s’enlise dans un niveau de détail rébarbatif, même si ils s’avèreront indispensables lors de la mise en œuvre. Bref ce chapitre dénote par rapport au reste du livre et coûte à l’auteur au moins un point de notation.

Les chapitres 5 à 7 traitent du NAS, dans le même ordre des sujets que pour le SAN : architecture, gestion et sauvegarde. On retrouve la qualité et la vigueur du propos, il n’y a rien à y redire. On a un peu plus de chance côté sauvegarde car le chapitre est plus concis.

En bref, voici un excellent livre sur le sujet, qui vous permettra d’aborder le sujet, avant de plonger plus en profondeur si vous en avez le besoin. Il faut prendre un peu de distance technologique car le livre est ancien. Aussi une seconde édition me paraît maintenant indispensable.

using-SAN-NAS

Référence complète : Using SANs and NAS – W. Curtis Preston – O’Reilly & associates 2002 – ISBN : 0-596-00153-3

Using Sans and NAS: Help for Storage Administrators


http://www.goodreads.com/book/add_to_books_widget_frame/0596001533?atmb_widget%5Bbutton%5D=atmb_widget_1.png&atmb_widget%5Bhide_friends%5D=on

Note de lecture : Logiciels de stockage de données, par Guy Chesnot

Note : 3 ; Quelques informations intéressantes dans un ouvrage déjà très vieillissant, affublé de plus d’une approche trop académique.

Ce livre s’intéresse au stockage de données, d’un point de vue des logiciels d’exploitation de bas niveau. C’est certes un choix, mais je regrette personnellement qu’il fasse autant abstraction de l’architecture matérielle sous-jacente, car l’aspect intéressant réside dans le couplage des deux. Mon second grand regret vient de l’évident vieillissement du texte. Celui-ci ne traite absolument pas de la virtualisation du stockage qui est pourtant l’axe de développement le plus important aujourd’hui. L’ouvrage se découpe en 9 chapitres.

Le premier chapitre expose les principes généraux du stockage de données, les caractéristiques qui y sont attendues, etc… Bref, on campe le décors et l’on y apprend pas grand-chose.

Le second chapitre qui traite tout bonnement des systèmes de gestion de fichiers reprend réellement les choses à la base. Les principes d’adossement du système de fichier aux disques physiques y sont abordés. L’objectif n’est pas de traiter en profondeur les stratégies et algorithmes de mapping entre système de fichier et ressources physiques (un sujet qui exigerait au moins un livre à lui tout seul), mais le deal est incontestablement rempli. Aujourd’hui il faudrait aussi parler des SSD, mais nous sommes en 2007…

On passe à la vitesse supérieure avec le chapitre 3 qui aborde les systèmes de fichier répartis. Évidemment on y aborde NFS et ses dérivés. Le traitement du sujet est quelque peu frustrant, car limité aux principes et donc assez abstrait.

Le chapitre suivant (le 4) consacré à l’hétérogénéité aborde le cas des réseaux mixant des systèmes Windows et Unix, entre autres, et partageant leurs ressources de stockage. Un propos hélas destiné à l’obsolescence et justement devenu obsolète.

Dans le chapitre 5, ce sont les systèmes de fichiers partagés, donc les NAS et autres SANs qui y sont abordés. C’est mon sujet d’intérêt principal et il n’est pas abordé de façon assez concrète. On en ressort pas avec une bonne appréhension des architectures SAN, par exemple. Donc exit.

Sauvegarde et restauration sur bande sont traités au chapitre VI. Quand on méconnaît le sujet, comme moi, il s’agit là d’une bonne introduction, présentant fort judicieusement les différentes options et stratégies.

La gestion des hiérarchies de stockage (tels que les stockages secondaires) couverte au chapitre 7 est la continuité logique du chapitre 6. La encore, on apprend pas mal de choses, mais le refus de l’auteur d’aborder la question de l’architecture physique afférente rend hélas ce chapitre insoutenablement abstrait.

Toujours dans le même fil, le chapitre 8 est dédié à l’archivage. Je n’ai pas grand-chose à en dire.

On garde souvent le plus important pour la fin, c’est le cas ici. Le chapitre 9 traite de l’intégration : architecture, gestion des volumes, etc. sont traités ici. C’est seulement un peu court et un peu tard.

Il est dommage qu’un ouvrage ayant choisi un sujet de niche si pertinent soit si décevant. L’auteur n’est pas en mal de connaissance, mais le ciblage de son propos rend celui-ci peu pertinent. Ceci couplé avec un vieillissement prématuré (en 2007, imaginez aujourd’hui …) et un style rédactionnel fort peu sexy me conduit à déconseiller cette lecture.

logiciels-stockage-donnees

Référence complète : Logiciels de stockage de données – Guy Chesnot – Vuibert 2000 – ISBN : 2-7117-8667-6

Logiciels de stockage de données


http://www.goodreads.com/book/add_to_books_widget_frame/2711786676?atmb_widget%5Bbutton%5D=atmb_widget_1.png&atmb_widget%5Bhide_friends%5D=on

Note de lecture : SAN et NAS, Solutions de stockage par Xavier Bouchet & Henri Gillarès-Calliat

Note : 6 ; Un tour d’horizon clair et agréable à lire, mais attention à l’obsolescence !

Clairement, ce livre remplis bien son office, c’est-à-dire poser les fondations de ce que sont les SAN et le NAS, ce qui n’est pas si évident. Si le premier chapitre est un peu « bateau », il présente quand même l’intérêt de bien faire comprendre l’objectif poursuivit par le SAN, à savoir un réseau dédié au stockage et même la virtualisation de ce stockage. Le reste du livre est découpé en 3 parties.

La première partie est directement consacrée au SAN et lui consacre 6 chapitres. Le chapitre 2, le premier de cette seconde partie est le plus riche d’enseignements car il décrit clairement les différentes typologies de réseaux SAN. A contrario, si dans l’absolu la norme SCSI n’est pas hors totalement hors sujet, le chapitre 3 qui lui est dédié est quand même très technique, et les auteurs auraient pu faire l’impasse dessus. Je soupçonne que c’est le niveau de technicité de l’un des auteurs en la matière qui a guidé ce choix. C’est aussi pour cela, je pense que le chapitre 4 consacré au fiber channel n’est pas moins technique. Mais  comment parler de SAN sans parler de fiber channel, n’est-ce pas ? Le chapitre 5 dédié aux différentes approches de la virtualisation est le second plus intéressant de cette partie. Le tableau dressé est bien plus limpide que celui réalisé dans le « storage virtualization » de Tom Clark. Les deux derniers chapitres sont consacrés aux protocoles montés au-dessus d’IP : iFCP et iSCSI. Malgré le penchant très technique déjà évoqué, ces chapitres sont clairs, mais ils n’évoquent pas la place de ces solutions dans un SAN : liaisons grandes distances, topologies avec gateways, considérations de sécurité…

La troisième partie est dédiée aux NAS et est complètement décorellée de la partie précédente. Il n’y a que deux chapitres dans cette partie, le premier d’entre eux, le chapitre 8 est dédié au SAN proprement dit. Si le sujet est correctement et encore une fois clairement traité, on regrettera que le sujet ne soit pas connecté au sujet précédent. J’ai du mal à croire que personne n’ait pensé à réaliser un NAS (ou un cluster de NASs) au-dessus d’un SAN… Le chapitre 9, consacré à NFS est pratiquement hors sujet. Mais comme on dit : ça ne gêne pas !

La dernière partie traite de sauvegarde, de médias de stockage et de plans de secours. Dans cet ordre. C’est un peu décousu, mais ça complète bien le sujet. J’ai particulièrement apprécié le chapitre consacré à l’archivage sur bande, malgré que l’auteur se réserve, avec un propos particulièrement partisan, aux technologies LTO et AIT. On regrettera aussi que ce chapitre 10 donne si peu d’indication sur la façon dont ces médias s’inscrivent dans un SAN ! Les chapitres 11, 12 et 13 sont consacrés respectivement aux disques durs, aux CD-ROM et aux DVD. Les chapitres 12 et 13 ont vieilli prématurément et apportent peu au sujet, tandis que le chapitre 11, si il n’est pas indispensable au sujet nous donne une vision claire et complète des technologies liées aux disques durs et de leurs implications. Le chapitre 14 consacré aux plans de secours se raccorde certes assez mal au reste du sujet, mais il est clair et bien écrit et donne assez de billes pour inciter à compléter nos connaissances sur le sujet. Je considère donc qu’il remplit son office.

Bref, je n’ai pas regretté ma lecture (lecture aisée, d’ailleurs, car j’ai achevé le texte en 2 jours sans forcer). Je le recommande, avec la réserve toutefois que le livre pourrait utilement être actualisé. Au contraire de l’ouvrage de Tom Clarke, les auteurs ont fait (à juste titre, je pense) le choix de faire référence aux technologies. Hélas, le texte vieillit d’autant plus vite. Il serait temps de sortir une seconde édition !

SAN-NAS-InfraStok

Référence complète : SAN et NAS, Solutions de stockage, sécurité, infrastructure – Xavier Bouchet & Henri Gillarès-Calliat – Dunod 2003 – ISBN : 2-10-005404-X

San Et Nas:  Les Infrastructures Des Réseaux De Stockage


http://www.goodreads.com/book/add_to_books_widget_frame/210005404X?atmb_widget%5Bbutton%5D=atmb_widget_1.png&atmb_widget%5Bhide_friends%5D=on

Note de lecture : Blade Servers and Virtualization, par Barb Goldworm & Anne Skamarock

Note : 5 ; Un bon guide pour le décideur, toujours intéressant sur les concepts, vieillissant sur les aspects et peu précis sur la techniques et obsolète sur la 3ème partie.

Cet ouvrage est en fait le seul que j’ai pu trouver traitant des serveurs blade. En fait, peut-être n’y a-t-il pas assez à dire pour susciter une littérature assez large ? Quoi qu’il en soit, celui-ci correspond à mes attentes : évoquer les architectures matérielles à base de serveurs blades. C’est donc assez naturellement que sont évoquées la mutualisation d’infrastructure, et notamment la connectivité, mais aussi l’alimentation électrique et le refroidissement.

Ces deux derniers sujets méritent certainement deux mots d’explications. En effet, les centres de calculs sont connus pour poser de gros problèmes de refroidissement, qui s’accentuent avec la puissance croissante des serveurs. Il est également connu que les coûts d’exploitation sont directement corrélés à la consommation électrique (avec un coût de l’électricité lui-même en forte augmentation). Le dernier paramètre étant l’occupation au sol, qui est lui-même lié aux problématiques de câblages et de refroidissement. Les serveurs blades améliorent la situation sur ces différents paramètres, tandis que la virtualisation améliore l’utilisation des serveurs et par là-même le coûts d’exploitation. La première partie du livre est consacrée à l’ évocation de ces points. Il ne s’agit que de 45 pages, la partie suivante, qui en compte 90, rentre au cœur du sujet.

La seconde partie est consacrée à l’évocation des différents aspects des blades et de la virtualisation. Elle fait bien son œuvre, sauf dans la partie dédiée à la connectivité, où d’avantage de précisions, de schémas et d’exemples auraient été bienvenus. Cette partie s’étend même aux problématiques de stockage (donc la relation avec les SANs), à la supervision et au clustering !

La troisième partie ressemble à un « guide d’achat » » : quelles sont les bonnes questions à se poser, les points à vérifier, le tout complété de matrices de comparaisons sur les différentes solutions du marché. Cela a été une présentation judicieuse du paysage à l’époque, mais elle n’est plus d’actualité.

La quatrième partie consacrée aux solutions s’est fanée avec l’âge, comme on pouvait s’y attendre. C’est dommage, car non seulement le tour du marché nous permet d’appréhender celui-ci, mais surtout les retours d’expérience du chapitre 17 sont particulièrement précieux.

Bref, voici un livre plutôt facile à lire, offrant un bon instantané sur la situation du marché et les tenants et aboutissants d’un choix. J’ai quand même été un peu frustré sur les éléments pouvant me permettre de comprendre la connectivité et donc d’établir un choix d’architecture.

L’obsolescence inévitable de l’ouvrage nécessiterait une nouvelle édition, en fait une nouvelle édition tous les deux ou trois ans au moins. Ce n’est pas le cas et c’est dommage.

blade-servers-virtualization

Référence complète : Blade Servers and Virtualization, transforming enterprise computing while cutting costs – Barb Goldworm & Anne Skamarock – John Wiley & sons 2007 – EAN : 978 0 471 78395 4

Blade Servers and Virtualization: Transforming Enterprise Computing While Cutting Costs


http://www.goodreads.com/book/add_to_books_widget_frame/0471783951?atmb_widget%5Bbutton%5D=atmb_widget_1.png&atmb_widget%5Bhide_friends%5D=on