Vincent Heuschling

Fondateur d’Affini-Tech et expert BigData, NOSQL & Analytics

Talks

Ce que Apache Spark change par rapport à Hadoop. Pourquoi l’utiliser ? Comment fonctionne-t-il ? le tout par des exemples de code simples et concrets. Au delà des modules ‘core’, explication et démonstrations des modules complémentaires : Spark MLLib pour faire du Machine Learning distribué, ‘Spark Streaming’ pour le traitement de flux sent temps réel, et ‘Spark GraphX’ pour traiter des données en Graphes.

Bases de données NOSQL

🏳️ FR #hadoop #nosql

Comprendre les différences entre Redis, Cassandra, HBase et MongoDB. Quelle base pour quel usage ?

Développement Hadoop avec Scalding

🏳️ FR #hadoop #nosql

Utiliser la bibliothèque Cascading avec Scala pour construire des jobs Map/Reduce avec toutes les capacités propres à Scala.

Google Cloud Platform

🏳️ FR #hadoop #nosql

Description et démonstrations des différentes briques de la Google Cloud Platform, ses particularités par rapport aux autres Cloud du marché. Pourquoi cette plateforme est un super accélérateur des projets Bigdata avec ses solutions uniques que sont ‘Bigquery’, Bigtable’, ‘Cloud storage’, ‘app engine’, ‘dataflow’, ‘compute engine’ pour facilement monter des clusters Hadoop & Spark

Hadoop et son écosystème

🏳️ FR #hadoop #nosql

Comprendre le fonctionnement d’Hadoop et de son écosystème, exemple simple de job Map/Reduce à l’appui

Hadoop Pig

🏳️ FR #hadoop #nosql

Utiliser Pig pour construire des traitements sur Hadoop. Une alternative à Map/Reduce Java beaucoup plus simple et productive.