020BIGES4

Big Data

Introduction : Les enjeux des données massives, Calcul distribué, HPFS et MapReduce, Analyse des liens et PageRank, Ensembles similaires (MinHashing et Local Sensitive Hashing), Sous-ensembles similaires (A-priori alogithm), Détection des communautés dans les graphes (clustering et BigClam), Traitement des flots de données, Systèmes de recommandation, Détection des ensembles séparables.


Temps présentiel : 35 heures


Charge de travail étudiant : 60 heures


Méthode(s) d'évaluation : Examen final