Xebia, le Paris Spark meetup et Cloudera, en la présence de Sean Owen, vous invitent à un meetup exceptionnel !

Apache Spark, Spark ML, recommendation, etc. vous intéressent ? Rendez-vous le 11 juin prochain à la Société Générale (corporate & investment banking) !

En partenariat avec la SGCIB, le Paris Spark Meetup et Cloudera (en la présence de Sean Owen, Directeur of Data Sciences), nous organisons l’événement data de ce début d’été.

A ne pas manquer !

Le programme

Pour ce meetup, nous vous avons concocté un joli programme :

19h00 : accueil des participants
19h15 : Présentation de Sean Owen (Cloudera) : A taste of random decision forests on Apache Spark
Apache Spark has a lot to like for the data scientist: natively distributed, REPL, Scala and Python APIs, and a machine learning library, MLlib. Spark 1.2 includes an implementation of random decision forests, an important classifier/regressor algorithm. This talk will introduce Spark, Scala, and random decision forests, and demonstrate the process of analyzing a real-world data set with them.
20h00 : Présentation de Matthieu Blanc et Julien Buret (Xebia) : Spark Dataframe et Spark ML
La dernière version de Spark nous apporte une nouvelle API inspirée des librairies et langage d’analyse statistique. Nous verrons comment Spark Dataframe nous permet de simplement manipuler et explorer les données en conservant la scalabilité de Spark RDD.

Dans un second temps, Matthieu Blanc présentera spark.ml. En effet, la version 1.2 de Spark a introduit ce nouveau package qui fournit une API de haut niveau permettant la création de pipeline de machine learning. Nous verrons ensemble les concepts de base de cet API à travers un exemple.
20h30 : Présentation Bertrand Dechoux (Influans) : Search as recommendation
Recherche full-text et recommandation, deux mondes à part? Nous verrons qu’il est possible de marier Lucene (Elastic Search/Solr) et filtrage collaboratif afin de produire un système de recommandation flexible et scalable. Cela passera par un aperçu des dernières sorties : la plateforme Confluent (Kafka) ainsi que Mahout 0.10 (avec Samsara).
21h00 : Cocktail dinatoire

Pour vous inscrire, c’est par ici.

En attendant

Pour patienter jusque là, nos TechTrends sont toujours à disposition. Le numéro 1 vous présente le Big Data et le numéro 6, le Data Lab.

Bonne lecture

Xebia, le Paris Spark meetup et Cloudera, en la présence de Sean Owen, vous invitent à un meetup exceptionnel !

Le programme

En attendant

Trending Articles

Celleneuve - Isis Hammam

IPEF (liste d'aptitude)

Libreville : Studio à louer au ront point de nzeng ayong (Libreville)

Dakar : studio a louer a ouest foire au 2eme etage (Dakar) 100 000 FCFA

SUNU YOONOU ZIARRE GENERALE - Comment faire sa Ziarra? Les invocations et la...

Location maison à Hodan 1

[Thermique] Code erreur E60 chaudière Geminox FCX22

enregistrement / erreur F3416-1

PowerShell et Microsoft Graph : comment envoyer des e-mails avec...

Yvelines. Disparition inquiétante à Vélizy-Villacoublay : avez-vous vu...

Table de mixage ETP MPX 4005 - 20 €

Contribution n° 01/2024 du 13 juin 2024 concernant le projet de délibération...

Rufisque : Salle de séminaire

douchka dinant

Vincennes - R1C4 - Vendredi 18 Octobre 2024 - Tiercé-Quarté-Quinté

[QGIS] Re: QGIS 3.0.3: import fichier texte délimité

Recensement au titre du port sec à Tanghin-Dassouri : L'état nominatif des...

AMPLiS ANALOGIQUE STEREO D'EXCEPTION EAA PA 1000. Révisés, avec Factures. -...

Les sims 4 fichier scratch emdomagé

Le Prince d'Egypte [FRENCH DVDRiP] | Multi Liens