
Fondateur d’Affini-Tech et expert BigData, NOSQL & Analytics
Talks
Apache Spark
Ce que Apache Spark change par rapport à Hadoop. Pourquoi l’utiliser ? Comment fonctionne-t-il ? le tout par des exemples de code simples et concrets. Au delà des modules ‘core’, explication et démonstrations des modules complémentaires : Spark MLLib pour faire du Machine Learning distribué, ‘Spark Streaming’ pour le traitement de flux sent temps réel, et ‘Spark GraphX’ pour traiter des données en Graphes.
Bases de données NOSQL
Comprendre les différences entre Redis, Cassandra, HBase et MongoDB. Quelle base pour quel usage ?
Développement Hadoop avec Scalding
Utiliser la bibliothèque Cascading avec Scala pour construire des jobs Map/Reduce avec toutes les capacités propres à Scala.
Google Cloud Platform
Description et démonstrations des différentes briques de la Google Cloud Platform, ses particularités par rapport aux autres Cloud du marché. Pourquoi cette plateforme est un super accélérateur des projets Bigdata avec ses solutions uniques que sont ‘Bigquery’, Bigtable’, ‘Cloud storage’, ‘app engine’, ‘dataflow’, ‘compute engine’ pour facilement monter des clusters Hadoop & Spark
Hadoop et son écosystème
Comprendre le fonctionnement d’Hadoop et de son écosystème, exemple simple de job Map/Reduce à l’appui
Hadoop Pig
Utiliser Pig pour construire des traitements sur Hadoop. Une alternative à Map/Reduce Java beaucoup plus simple et productive.