01 56 59 33 00
united-kingdom

BigData – Enjeux et opportunité

4-PP-BDBA
4-PP-BDBA
Durée : 2 jour(s)
soit 14 heures
Prix : 1200 €
Programmes
Introduction
  • Les origines du Big Data : un monde de données numériques, l’e-santé, chronologie
  • Une définition par les quatre V : la provenance des données
  • Une rupture : changements de quantité, de qualité, d’habitudes
  • La valeur de la donnée : un changement d’importance
  • La donnée en tant que matière première
  • Le quatrième paradigme de la découverte scientifique
Big Data : traitements depuis l’acquisition jusqu’au résultat
  • L’enchaînement des opérations
  • L’acquisition
  • Le recueil des données : crawling, scraping
  • La gestion de flux événementiels (Complex Event Processing, CEP)
  • L’indexation du flux entrant
  • L’intégration avec les anciennes données
  • La qualité des données : un cinquième V ?
  • Les différents types de traitement : recherche, apprentissage (machine learning, transactionnel, data mining)
  • D’autres modèles d’enchaînement : Amazon, e-Santé
  • Un ou plusieurs gisements de données ? De Hadoop à l’in-memory
  • De l’analyse de tonalité à la découverte de connaissances
Relations entre Cloud et Big Data
  • Le modèle d’architecture des clouds publics et privés
  • Les services XaaS
  • Les objectifs et avantages des architectures Cloud
  • Les infrastructures
  • Les égalités et les différences entre cloud et Big Data
  • Les clouds de stockage
  • Classification, sécurité et confidentialité des données
  • La structure comme critère de classification : non structurée, structurée, semi-structurée
  • Classification selon le cycle de vie : données temporaires ou permanentes, archives actives
  • Difficultés en matière de sécurité : augmentation des volumétries, la distribution
  • Les solutions potentielles
Introduction à l’Open Data
  • La philosophie des données ouvertes et les objectifs
  • La libération des données publiques
  • Les difficultés de la mise en œuvre
  • Les caractéristiques essentielles des données ouvertes
  • Les domaines d’application
  • Les bénéfices escomptés
Matériel pour les architectures de stockage
  • Les serveurs, disques, réseau et l’usage des disques SSD, l’importance de l’infrastructure réseau
  • Les architectures cloud et les architectures plus traditionnelles
  • Les avantages et les difficultés
  • Le TCO
  • La consommation électrique : serveurs (IPNM), disques (MAID)
  • Le stockage objet : principe et avantages
  • Le stockage objet par rapport aux stockages traditionnels NAS et SAN
  • L’architecture logicielle
  • Niveaux d’implantation de la gestion du stockage
  • Le « Software Defined Storage »
  • Architecture centralisée (Hadoop File System)
  • L’architecture Peer-to-Peer et l’architecture mixte
  • Les interfaces et connecteurs : S3, CDMI, FUSE, etc.
  • Avenir des autres stockages (NAS, SAN) par rapport au stockage objet
Protection des données
  • La conservation dans le temps face aux accroissements de volumétrie
  • La sauvegarde, en ligne ou locale ?
  • L’archive traditionnelle et l’archive active
  • Les liens avec la gestion de hiérarchie de stockage : avenir des bandes magnétiques
  • La réplication multisites
  • La dégradation des supports de stockage
Méthodes de traitement et champs d’application
  • Classification des méthodes d’analyse selon le volume des données et la puissance des traitements
  • Hadoop : le modèle de traitement Map Reduce
  • L’écosystème Hadoop : Hive, Pig. Les difficultés d’Hadoop
  • OpenStack et le gestionnaire de données Ceph
  • Le Complex Event Processing : un exemple ? Storm
  • Du BI au Big Data
  • Le décisionnel et le transactionnel renouvelés : les bases de données NoSQL
  • Typologie et exemples
  • L’ingestion de données et l’indexation
  • Deux exemples : splunk et Logstash
  • Les crawlers Open Source
  • Recherche et analyse : Elasticsearch
  • L’apprentissage : Mahout. In-memory
  • Visualisation : temps réel ou non, sur le Cloud (Bime), comparaison QlikView, Tibco Spotfire, Tableau
  • Une architecture générale du data mining via le Big Data
Cas d’usage à travers des exemples et conclusion
  • L’anticipation : besoins des utilisateurs dans les entreprises, maintenance des équipements
  • La sécurité : des personnes, détection de fraude (postale, taxes), le réseau
  • La recommandation. Analyses marketing et analyses d’impact
  • Analyses de parcours. Distribution de contenu vidéo
  • Big Data pour l’industrie automobile ? Pour l’industrie pétrolière ?
  • Faut-il se lancer dans un projet Big Data ?
  • Quel avenir pour les données ?
  • Gouvernance du stockage des données : rôle et recommandations, le Data Scientist, les compétences d’un projet Big Data
Objectifs
Découvrir les principaux concepts du Big Data
Identifier les enjeux économiques
Evaluer les avantages et les inconvénients du Big Data
Comprendre les principaux problèmes et les solutions potentielles
Identifier les principales méthodes et champs d’application du Big Data
Prérequis
Connaissances de base des architectures techniques
Profil des participants
DSI, directeurs techniques, chefs de projet, architectes, responsables SI
Dates des prochaines sessions :
Du 4 au 5 janvier 2024
Du 19 au 20 février 2024
Du 16 au 17 avril 2024
Du 27 au 28 juin 2024
Du 19 au 20 août 2024
Du 30 septembre au 1 octobre 2024
Du 25 au 26 novembre 2024
Découvrir les principaux concepts du Big Data
Identifier les enjeux économiques
Evaluer les avantages et les inconvénients du Big Data
Comprendre les principaux problèmes et les solutions potentielles
Identifier les principales méthodes et champs d’application du Big Data
Introduction
  • Les origines du Big Data : un monde de données numériques, l’e-santé, chronologie
  • Une définition par les quatre V : la provenance des données
  • Une rupture : changements de quantité, de qualité, d’habitudes
  • La valeur de la donnée : un changement d’importance
  • La donnée en tant que matière première
  • Le quatrième paradigme de la découverte scientifique
Big Data : traitements depuis l’acquisition jusqu’au résultat
  • L’enchaînement des opérations
  • L’acquisition
  • Le recueil des données : crawling, scraping
  • La gestion de flux événementiels (Complex Event Processing, CEP)
  • L’indexation du flux entrant
  • L’intégration avec les anciennes données
  • La qualité des données : un cinquième V ?
  • Les différents types de traitement : recherche, apprentissage (machine learning, transactionnel, data mining)
  • D’autres modèles d’enchaînement : Amazon, e-Santé
  • Un ou plusieurs gisements de données ? De Hadoop à l’in-memory
  • De l’analyse de tonalité à la découverte de connaissances
Relations entre Cloud et Big Data
  • Le modèle d’architecture des clouds publics et privés
  • Les services XaaS
  • Les objectifs et avantages des architectures Cloud
  • Les infrastructures
  • Les égalités et les différences entre cloud et Big Data
  • Les clouds de stockage
  • Classification, sécurité et confidentialité des données
  • La structure comme critère de classification : non structurée, structurée, semi-structurée
  • Classification selon le cycle de vie : données temporaires ou permanentes, archives actives
  • Difficultés en matière de sécurité : augmentation des volumétries, la distribution
  • Les solutions potentielles
Introduction à l’Open Data
  • La philosophie des données ouvertes et les objectifs
  • La libération des données publiques
  • Les difficultés de la mise en œuvre
  • Les caractéristiques essentielles des données ouvertes
  • Les domaines d’application
  • Les bénéfices escomptés
Matériel pour les architectures de stockage
  • Les serveurs, disques, réseau et l’usage des disques SSD, l’importance de l’infrastructure réseau
  • Les architectures cloud et les architectures plus traditionnelles
  • Les avantages et les difficultés
  • Le TCO
  • La consommation électrique : serveurs (IPNM), disques (MAID)
  • Le stockage objet : principe et avantages
  • Le stockage objet par rapport aux stockages traditionnels NAS et SAN
  • L’architecture logicielle
  • Niveaux d’implantation de la gestion du stockage
  • Le « Software Defined Storage »
  • Architecture centralisée (Hadoop File System)
  • L’architecture Peer-to-Peer et l’architecture mixte
  • Les interfaces et connecteurs : S3, CDMI, FUSE, etc.
  • Avenir des autres stockages (NAS, SAN) par rapport au stockage objet
Protection des données
  • La conservation dans le temps face aux accroissements de volumétrie
  • La sauvegarde, en ligne ou locale ?
  • L’archive traditionnelle et l’archive active
  • Les liens avec la gestion de hiérarchie de stockage : avenir des bandes magnétiques
  • La réplication multisites
  • La dégradation des supports de stockage
Méthodes de traitement et champs d’application
  • Classification des méthodes d’analyse selon le volume des données et la puissance des traitements
  • Hadoop : le modèle de traitement Map Reduce
  • L’écosystème Hadoop : Hive, Pig. Les difficultés d’Hadoop
  • OpenStack et le gestionnaire de données Ceph
  • Le Complex Event Processing : un exemple ? Storm
  • Du BI au Big Data
  • Le décisionnel et le transactionnel renouvelés : les bases de données NoSQL
  • Typologie et exemples
  • L’ingestion de données et l’indexation
  • Deux exemples : splunk et Logstash
  • Les crawlers Open Source
  • Recherche et analyse : Elasticsearch
  • L’apprentissage : Mahout. In-memory
  • Visualisation : temps réel ou non, sur le Cloud (Bime), comparaison QlikView, Tibco Spotfire, Tableau
  • Une architecture générale du data mining via le Big Data
Cas d’usage à travers des exemples et conclusion
  • L’anticipation : besoins des utilisateurs dans les entreprises, maintenance des équipements
  • La sécurité : des personnes, détection de fraude (postale, taxes), le réseau
  • La recommandation. Analyses marketing et analyses d’impact
  • Analyses de parcours. Distribution de contenu vidéo
  • Big Data pour l’industrie automobile ? Pour l’industrie pétrolière ?
  • Faut-il se lancer dans un projet Big Data ?
  • Quel avenir pour les données ?
  • Gouvernance du stockage des données : rôle et recommandations, le Data Scientist, les compétences d’un projet Big Data
DSI, directeurs techniques, chefs de projet, architectes, responsables SI
Connaissances de base des architectures techniques

Formateur expert dans le domaine

  • 1 ordinateur par stagiaire, 1 support de cours par stagiaire (version papier ou numérique), 1 stylo et un bloc-notes par stagiaire
  • Vidéoprojecteur et tableau blanc
  • Feuille d’émargement à la demi-journée, questionnaire de satisfaction stagiaire, évaluations des acquis tout au long de la formation, attestation de stage
  • Éligible au CPF avec passage de certification TOSA ou PCIE (en option)

En amont de la formation

  • Audit par téléphone par nos commerciaux et formateurs
  • Tests d’auto-positionnement avant l’entrée en formation par le biais de questionnaire

Au cours de la formation

  • Exercices pratiques et mises en situation professionnelle pour valider la compréhension de chaque notion abordée dans le programme de cours.

En fin de formation

  • Validation des acquis par le formateur ou via un questionnaire renseigné par les stagiaires
  • Evaluation qualitative par les participants à l’issue de la formation via un questionnaire de satisfaction accessible en ligne
  • Une attestation de fin de formation reprenant les objectifs de formation est également remise aux stagiaires puis signée par le formateur

Modalités d’inscription

  • Inscription possible jusqu’à la veille de la formation, sous réserve de places disponibles, en nous contactant au 01 56 59 33 00 ou par mail formation@sii.fr

Modalités particulières

  • Nos formations sont accessibles aux personnes en situation de handicap. Renseignez-vous auprès de notre référente handicap au 01 56 59 33 00 ou par mail pedagogie@sii.fr
Du 4 au 5 janvier 2024
Du 19 au 20 février 2024
Du 16 au 17 avril 2024
Du 27 au 28 juin 2024
Du 19 au 20 août 2024
Du 30 septembre au 1 octobre 2024
Du 25 au 26 novembre 2024

Réservez votre formation

Que cherchez-vous ?