15Nov/18

Meetup Machine Learning Aix-Marseille S04E02

Meetup Machine Learning Aix-Marseille
Ce soir je participe au Meetup Machine Learning Aix-Marseille, pour la deuxième session de cette quatrième édition. J’interviens après Leonardo Noleto, data scientist senior chez Bleckwen FinTech qui développe une solution de lutte contre la fraude financière avec du machine learning. Je vais présenter le projet sur lequel Enora Belz, Romain Gaté, Vincent Malardé, Jimmy Merlet, Arthur Charpentier et moi avons travaillé l’été dernier à l’occasion de la Coupe du Monde de Football 2018 (c.f. billet précédent). L’idée était d’utiliser des techniques d’apprentissage automatique pour faire de la prévision de l’issue des matchs de football (victoire, match nul ou défaite).

Les slides sont disponibles à l’adresse suivante : http://www.egallic.fr/Recherche/Worldcup_2018/2018_meetup_ML/egallic_meetup.html

15Oct/18

Cours de Python

Logo Python
Dans le cadre d’un cours de programmation avec Python adressé aux étudiants de 2e année du Magistère Ingénieur Économiste à Aix-Marseille School of Economics, j’ai préparé des notes de cours. Ces dernières sont disponibles à plusieurs endroits, sous différents formats :

Ces différents formats ont été produits à l’aide du package R {bookdown}, tous les fichiers nécessaire à la compilation sont disponibles sur un dépôt GitHub.

Les documents sont susceptibles d’être mis à jour de temps en temps.

06Juil/18

Rencontres R 2018

Fifa World Cup 2018

Depuis mercredi, j’assiste aux 7e rencontres R, qui se tiennent à Agrocampus Ouest cette année.

À cette occasion, je vais présenter avant le déjeuner les travaux menés (working paper) avec Arthur Charpentier sur l’utilisation des données collaboratives de généalogie en démographie historique. Le format de la présentation est un lightning talk, c’est à dire une présentation rapide, 14 diapositives qui défilent toutes les 24 secondes.

Les diapositives sont en ligne, et pour rappel, les codes R sont proposés sur GitHub.

28Fév/18

Communes proches avec R

Rennes

Dans mes travaux actuels, j’ai besoin d’identifier pour une commune en particulier, quelles sont les autres communes proches, pour un rayon donné de 20km. Pour obtenir une telle information, je me suis appuyé sur les données de communes d’Open Street Map. L’idée est simple :

  • récupérer les frontières des communes ;
  • les étendre ;
  • regarder quelles communes sont en intersection avec les frontières étendues.
19Sep/17

Matinée d’exposés – COVEA

Covéa

En ce mardi 19 septembre, je prends le train (tôt) à destination de Paris pour participer à la matinée d’exposés avec les gens de la Chaire Actinfo dont je suis maintenant membre, pendant la durée de mon post-doc avec Arthur Charpentier.

Je vais présenter le travail effectué cet été sur les données collaboratives de généalogie. Ce sera l’occasion de parler de l’orientation vers laquelle Arthur et moi comptons suivre pour mener nos recherches liées à ces données.

Ce sera aussi l’occasion d’assister à la présentation des travaux d’Olivier Wintenberger.

06Sep/17

Conférence GEOMED 2017 à Porto (Portugal)

Porto 2017

Cette semaine, je vais assister à la conférence GEOMED2017 à Porto, au Portugal. Cette conférence réunit des chercheurs issus de différentes disciplines qui travaillent sur les statistiques spatiales, l’épidémiologie spatiale et la santé publique. Ce sera l’occasion d’assister à de nombreuses présentations pendant trois jours (et un jour supplémentaire durant lequel un workshop est proposé par Lee Duncan de l’Université de Glasgow, sur la modélisation des données spatiales sur R avec le package CARBayes).

17Nov/16

Mais où est Charlie ?


Hier, j’ai parcouru un article amusant de Randal S. Olson, intitulé « Here’s Waldo: Computing the optimal search strategy for finding Waldo« . Bon, ce n’est rien de nouveau, je sais, j’arrive un peu en retard, ça date de 2015. Quoi qu’il en soit, j’ai voulu apporter mon petit grain de sable au contenu proposé par Randal. Dans son billet, il explique qu’il a passé son week-end à chercher une stratégie optimale pour trouver Charlie. Vous savez, ce petit personnage en pull rayé rouge et blanc, avec un bonnet à pompom sur la tête. Pour ce faire, Randal a utilisé des techniques de machine learning. Il s’appuie sur une image publiée par Slate (Here’s Waldo, 2013, par Ben Blatt), qui répertorie la position de Charlie dans 68 double pages des albums. Randal extrait les coordonnées de l’image (et les partage gentiment).

[…]

16Fév/15

Qui va gagner la Nouvelle Star ? À vos votes Twitter !

Cumul des votes par candidat au cours de la soirée

La chaîne de télévision D8 diffuse pour la troisième année consécutive l’émission Nouvelle Star. Si ma mémoire est bonne, je n’avais pas suivi ce programme depuis la saison 2006-2007, mais j’avoue m’être pris au jeu cette année, d’autant plus que la production propose une nouveauté par rapport aux saisons précédentes : les votes par Twitter !

Jeudi dernier, le 12/02, lors du quatrième prime, je me suis diverti avec l’API de Twitter pour récupérer les tweets postés pendant l’émission.

Les résultats de ma petite analyse laissent penser que les votes par SMS et par téléphone pratiqués durant l’émission ne sont pas négligeable, et ne reflètent pas exactement ce qui se dit sur le réseau social Twitter.

Aussi, après un bref rappel du déroulement des primes, ce billet présentera quelques observations réalisées autour des tweets extraits pendant l’émission de jeudi. Une troisième partie s’adressant à ceux désirant récupérer eux-même les tweets et effectuer leur propre analyse, fournira quelques codes R.