Logo de l'organisme de formation

Contactez-nous pour vos formations intra ou inter

Représentation de la formation : Les nouvelles architectures de données (Séminaire)

Les nouvelles architectures de données (Séminaire)

5-023

Formation présentielle
Accessible
Durée : 12 heures (2 jours)
Durée :12 heures (2 jours)
Cette formation est gratuite.
S'inscrire
Durée :12 heures (2 jours)
Cette formation est gratuite.
S'inscrire
Durée :12 heures (2 jours)
Cette formation est gratuite.
S'inscrire

Besoin d’adapter cette formation à vos besoins ?

N’hésitez pas à nous contacter afin d’obtenir un devis sur mesure !

Formation créée le 05/11/2024. Dernière mise à jour le 07/03/2025.

Version du programme : 1

Programme de la formation Version PDF

L’informatique est indéniablement un domaine en perpétuelle et rapide évolution. Ne pas avoir pris conscience des innovations à court et moyen termes ainsi que de leurs impacts sur l'entreprise, c’est déjà prendre du retard. Ce séminaire propose une synthèse claire et précise des avancées les plus récentes de la gestion des données, une analyse du marché et des grandes solutions. Son ambition est de vous offrir un temps d’avance sur l’ensemble des technologies d’organisation des données. Cette formation a pour but d'amener les apprenants à un niveau SAME "Sensibilisation" et d'enrichir les compétences : * Créer et mettre à disposition un système de veille efficace (technologique, économique et stratégique) * Appliquer les spécificités des architectures des systèmes d’exploitation pour répondre aux contraintes des solutions informatiques choisies * Mettre en œuvre l’expertise informatique du domaine technique développé (par exemple, mise en place d’un nouveau module dans le système d’information * Conseiller  la Maîtrise d’Ouvrage sur les solutions techniques

Objectifs de la formation

  • Découvrir les notions centrales de stockage de données
  • Appréhender les enjeux des nouvelles architectures de données (Hadoop, NoSQL, Spark), et positionner leurs usages au sein de l’univers Big Data
  • Savoir manipuler ces technologies et les bases de données de façon conjointe, pour mener à bien des analyses efficaces

Profil des bénéficiaires

Pour qui
  • Architectes
  • Urbanistes
  • Managers informatiques et consultants
Prérequis
  • Aucun prérequis nécessaire

Contenu de la formation

  • Accès aux données
    • Les fichiers : Arborescence, formats
    • Les bases de données : Notion de catalogue, le langage SQL, Datawarehouses et Data Lake, Bases d’analyse
    • API : définition, web scraping
    • Traitements en mémoire
  • Les Architectures de données
    • Limites des systèmes traditionnels : Limites des fichiers, Limite des SGBD
    • Les architectures distribuées : OLTP, OLAP Distribution vs Replication
    • Concepts essentiels : Disponibilités, Cohérence, Tolérance à la partition
    • Les théorème CAP
    • Quorums
  • Bases NOSQL
    • Avantages et inconvénients
    • Modèles de données : Key-Value, Documents, Column-Family, Graph
    • Exemple : MongoDB
    • Les moteurs de recherche
  • Big Data et open data
    • Gestion des déluges de données en 3V » (volume, vélocité, variété) alimenté par les données d’entreprises, les « open data », les réseaux sociaux et les objets connectés
    • Stockage distribué HDFS et bases de données. Manipulation des données (Pig, Hive)
    • Programmation basée sur la parallélisation des traitements (MapReduce)
    • Le positionnement des structures "in-memory" de type HANA
    • Le positionnement des structures "in-memory" de type HANA
    • La place du Big Data et l'Open data, les technologies "In-Memory"
    • Les technologies disponibles : Hadoop, MapReduce, Pig, Hive
    • Amélioration de la pertinence de la recherche : le Web Sémantique
  • Hadoop
    • Introduction à Hadoop : Histoire, Ecosystème
    • HDFS
    • MapReduce : Les phases de MapReduce, Notion de job, Exemple
    • YARN
    • Les distributions
    • La ligne de commande
    • Administration d’un cluster : resource Manager, History Server, HUE
  • Le concept du Cloud
    • La place des applications en SaaS
    • Un mode de déploiement spécifique des applications
    • Les critères de sélection et le modèle économique
    • Synthèse et comparatif des modes de gestion des applications
    • Le stockage des données dans le cloud : S3, BLOB …
  • Le positionnement du Cloud
    • Les différents modes de distribution, TaaS, PaaS, IaaS
    • La partage et virtualisation du serveur
    • Les services du cloud et ces modes de gestion et de facturation
    • Les impacts juridiques et de sécurités
  • Découverte de SPACK
    • Spark Core : RDD, Transformations, Pair RDD
    • Spark SQL
    • Spark Streaming
    • Structured Streaming
Suivi de l'exécution et évaluation des résultats
  • Feuilles de présence
  • Quiz
  • Exercices pratiques
  • Formulaires d'évaluation de la formation
  • Certificat de réalisation de l’action de formation
Ressources techniques et pédagogiques
  • Tour d'horizon synthétique et complet
  • Pédagogie active : présentation magistrale en alternance avec études de cas et retours d’expérience
  • Répartition théorie/pratique : 70/30
  • Stage mis à jour en permanence, vous apportant les dernières nouveautés

Capacité d'accueil

Entre 3 et 15 apprenants

Délai d'accès

5 semaines

Accessibilité

Toute personne reconnue en situation de handicap et souhaitant accéder à notre parcours est invitée à nous contacter pour étudier ensemble la faisabilité de son projet de développement des compétences