HA/SLA HA COUR TP – Haute Disponibilité (HA) Table des matières - Définitions d’éléments servant à la HA - Mise en place d’une haute disponibilité sur un serveur web - Prérequis - Installation de Corosync et de Pacemaker Définitions d’éléments servant à la HA 1)  Qu’est-ce que la haute disponibilité ? La haute disponibilité (HA)     est le fait qu’un système puisse être accessible au plus proche de     100 % du temps, donc avec le moins d’interruption possible. La haute     disponibilité désigne aussi la capacité d’un système à rester     accessible et fiable presque 100 % du temps. Un système hautement     disponible doit pouvoir résister à des interruptions, qu’il s’agisse     de temps d’arrêt planifiés ou de sinistres à grande échelle. Un système HA répond généralement à deux critères clés : - Il doit rester disponible quasiment en permanence. - Il doit satisfaire un ensemble d’attentes prédéfinies de la part des utilisateurs. 2)  Pourquoi mettre en place la haute disponibilité ? La HA permet à des     utilisateurs d’un service qu’il soit accessible au plus proche de     100 % du temps et permet donc d’assurer la non interruption d’une     activité ayant besoin d’accéder en continu à un système. 3)  Qu’est-ce que “SLA” ? Le SLA, pour Service Level Agreement ou accord     de niveau de service, est le taux de disponibilité d’un service en     pourcentage et sur une année. C’est un contrat formel entre un fournisseur de services informatiques (interne ou externe) et un client (entreprise ou utilisateur final), qui définit : - les niveaux de service attendus - les engagements de performance - les méthodes de mesure de ces performances 4)  En quoi cela concerne la haute disponibilité ? Le SLA concerne la     haute disponibilité car il permet d’établir la complexité du système     d’HA à mettre en place, selon si on souhaite une disponibilité de     99.9 %, 99.99 %, 99.999 %, etc. La SLA est en partie basée sur la     haute disponibilité car si le site est indisponible, il n’y a plus     de disponibilité. 5)  Qu’est-ce que la réplication ? La réplication est le fait qu’un     élément soit recopié à l’identique pour que la copie serve à     remplacer ce dernier en cas de problème. C’est une duplication d’un     serveur ou d’un service à des fins de haute disponibilité. 6)  Qu’est-ce qu’un cluster ? Un cluster est un groupe d’éléments     regroupés qui fonctionnent ensemble. Un cluster informatique est un     groupe d’ordinateurs ou de serveurs indépendants, interconnectés,     qui fonctionnent comme un seul système cohésif. 7)  Qu’est-ce que Corosync ? Corosync est un service permettant de gérer     des clusters de machines et de gérer leur accessibilité. C’est un     service qui permet de faire fonctionner la haute disponibilité. Dans le cadre de la HA : - Il gère le serveur maître et les serveurs secondaires - En cas de panne, un serveur secondaire prend le relais Fonctionnement : - Chaque serveur envoie régulièrement un message appelé heartbeat - Ces messages passent par un lien Corosync - Si le serveur maître ne répond plus, un vote est organisé En cas d’absence de majorité : - Un Quorum permet de trancher 8)  Qu’est-ce qu’une IP virtuelle ? Une adresse IP virtuelle est une     adresse IP non liée à une interface physique mais à un service ou un     cluster. Elle permet à plusieurs machines d’être accessibles via une     seule adresse IP. 9)  Qu’est-ce qu’une IP failover ? Une IP failover est une adresse IP     pouvant être transférée rapidement d’un serveur à un autre sans     interruption de service. Elle permet : - un basculement rapide - la continuité de service - la redondance en cas de panne 10) Fonctionnement de l’IP Failover dans la HA (IP failover utilisée     pour basculer rapidement vers un serveur de secours en cas de panne) 11) Qu’est-ce que Pacemaker ? Pacemaker est un logiciel open source de     gestion de cluster haute disponibilité. Il permet de : -   démarrer, arrêter et superviser les ressources -   garantir la continuité des services Il fonctionne souvent avec Corosync, qui gère la communication entre les nœuds. 12) Qu’est-ce qu’une ressource (Pacemaker) ? Une ressource est un     service ou un élément que le cluster doit gérer pour assurer la     haute disponibilité. Exemples : serveur web (Apache, Nginx), base de     données, etc. 13) Qu’est-ce qu’un script OCF ? Un script OCF (Open Cluster Framework)     est un script utilisé comme agent de ressource. Il permet : -   de démarrer / arrêter un service -   de surveiller son état 14) Qu’est-ce qu’un CIB ? (CIB mentionné mais non défini dans les     textes) Mise en place d’une haute disponibilité sur un serveur web Prérequis Il faut : - un serveur LAP avec un service web (ex : GLPI) - un VHOST configuré (nom de domaine + IP) - un serveur de base de données fonctionnel Reprendre à : « Installation de GLPI à partir de l’interface web » Installation de Corosync et de Pacemaker 1.  Installer les paquets : apt install corosync pacemaker pcs 2.  Cloner le serveur ou en créer un second avec les mêmes services 3.  Générer une clé : corosync-keygen 4.  Copier la clé vers le serveur esclave : scp /etc/corosync/authkey     root@:/etc/corosync/authkey Configuration de Corosync Modifier le fichier : /etc/corosync/corosync.conf Dans le bloc totem : - ajouter : secauth: on - modifier : cluster_name - ajouter : transport: udpu Dans le bloc nodelist : -   Ajouter un node pour le serveur maître :     -   ring0_addr : IP du serveur maître     -   name : nom -   Ajouter un node pour le serveur esclave avec ses informations HA installation