Tag Archives: Arthur Charpentier

15Nov/18

Meetup Machine Learning Aix-Marseille S04E02

Meetup Machine Learning Aix-Marseille
Ce soir je participe au Meetup Machine Learning Aix-Marseille, pour la deuxième session de cette quatrième édition. J’interviens après Leonardo Noleto, data scientist senior chez Bleckwen FinTech qui développe une solution de lutte contre la fraude financière avec du machine learning. Je vais présenter le projet sur lequel Enora Belz, Romain Gaté, Vincent Malardé, Jimmy Merlet, Arthur Charpentier et moi avons travaillé l’été dernier à l’occasion de la Coupe du Monde de Football 2018 (c.f. billet précédent). L’idée était d’utiliser des techniques d’apprentissage automatique pour faire de la prévision de l’issue des matchs de football (victoire, match nul ou défaite).

Les slides sont disponibles à l’adresse suivante : http://www.egallic.fr/Recherche/Worldcup_2018/2018_meetup_ML/egallic_meetup.html

06Juil/18

Rencontres R 2018

Fifa World Cup 2018

Depuis mercredi, j’assiste aux 7e rencontres R, qui se tiennent à Agrocampus Ouest cette année.

À cette occasion, je vais présenter avant le déjeuner les travaux menés (working paper) avec Arthur Charpentier sur l’utilisation des données collaboratives de généalogie en démographie historique. Le format de la présentation est un lightning talk, c’est à dire une présentation rapide, 14 diapositives qui défilent toutes les 24 secondes.

Les diapositives sont en ligne, et pour rappel, les codes R sont proposés sur GitHub.

11Avr/18

Séminaire à l’INED, 2018

Rougon-Macquart
Demain je vais à l’INED pour présenter les résultats du papier co-écrit avec Arthur Charpentier sur les données collaboratives de généalogie et sur leur utilisation en démographie historique. La présentation aura lieu au sein de l’unité de recherche « Histoire et Population« .

Le diapositive qui accompagnent la présentation sont disponibles à l’intérieur de l’article.

07Mar/18

Démographie historique et données collaboratives

Généalogie de Victor Hugo

Il y a quelques mois, j’indiquais dans un billet du blog que j’avais présenté les débuts des travaux engagés avec Arthur Charpentier au sujet de la démographie historique à partir de données collaboratives issues du site geneanet.org. J’avais également fait part de l’avancée des recherches lors d’une matinée d’exposés avec les membres de la chaire Actinfo (c.f. billet). Aujourd’hui, Arthur et moi avons déposé un document de travail intitulé « Étude de la démographie française du XIXe siècle à partir de données collaboratives de généalogie » sur HAL.

Dans ce papier, nous explorons un jeu de données de 2,45 millions d’individus, correspondant à des personnes nées entre 1800 et 1804 en France ainsi qu’à leurs descendants sur 3 générations. Les données brutes étaient gigantesques : plus de 700 000 000 de lignes. Chaque ligne représente un événement (naissance, mariage ou décès) pour un individu dans l’arbre d’un utilisateur de geneanet.org. Or, comme chaque utilisateur créé son propre arbre (il faut noter que nous n’avons pas accès aux arbres des utilisateurs n’ayant pas souhaité le rendre public), les individus se retrouvent dupliqués dans la base. Un gros travail d’appariement et de nettoyage des arbres a donc été réalisé et a conduit à ce nombre de 2,45 millions d’individus.

19Sep/17

Matinée d’exposés – COVEA

Covéa

En ce mardi 19 septembre, je prends le train (tôt) à destination de Paris pour participer à la matinée d’exposés avec les gens de la Chaire Actinfo dont je suis maintenant membre, pendant la durée de mon post-doc avec Arthur Charpentier.

Je vais présenter le travail effectué cet été sur les données collaboratives de généalogie. Ce sera l’occasion de parler de l’orientation vers laquelle Arthur et moi comptons suivre pour mener nos recherches liées à ces données.

Ce sera aussi l’occasion d’assister à la présentation des travaux d’Olivier Wintenberger.

06Sep/17

Conférence GEOMED 2017 à Porto (Portugal)

Porto 2017

Cette semaine, je vais assister à la conférence GEOMED2017 à Porto, au Portugal. Cette conférence réunit des chercheurs issus de différentes disciplines qui travaillent sur les statistiques spatiales, l’épidémiologie spatiale et la santé publique. Ce sera l’occasion d’assister à de nombreuses présentations pendant trois jours (et un jour supplémentaire durant lequel un workshop est proposé par Lee Duncan de l’Université de Glasgow, sur la modélisation des données spatiales sur R avec le package CARBayes).

27Août/13

Deuxièmes Rencontres R à Lyon

Le 27 et 28 juin 2013, se déroulaient les 2e Rencontres R, à Lyon. J’aimerais faire un petit bilan de ce que j’ai pu voir pendant ces deux journées.

En premier lieu, j’aimerais souligner la qualité de l’organisation. Tout était millimétré, l’accueil était très agréable et les membres de l’équipe organisatrice étaient très sympathiques. Dès l’arrivée, une malette (biodégradable) est remise à chaque participant, contenant un programme relié et en couleur, ainsi que quelques goodies provenant de Revolution Analytics.