En | Ar

020BDFRM3

Big Data frameworks

Conceptuellement, le cours est divisé en deux parties.  La première couvre les concepts fondamentaux de l'informatique parallèle MapReduce, à travers les yeux de Hadoop, MrJob et Spark, tout en plongeant profondément dans Spark, des trames de données, le Spark Shell, Spark Streaming, Spark SQL, MLlib. Les élèves utiliseront MapReduce pour les applications et les déploiements industriels pour différents domaines, y compris la publicité, la finance, la santé et les moteurs de recherche.  La deuxième partie se concentre sur la conception algorithmique et le développement dans les environnements informatiques parallèles (Spark), le développement d'algorithmes (arbre de décision apprentissage), des algorithmes de traitement graphique (pagerank / court chemin), les algorithmes de newton, les support vector machines.


Temps présentiel : 35 heures


Charge de travail étudiant : 70 heures


Méthode(s) d'évaluation : Examen final

Ce cours est proposé dans les diplômes suivants
 Master en data sciences