07avril/18

Conférence EENR, Orléans

Orléans, 2018

Jeudi 5 et vendredi 6 Avril, j’étais au Laboratoire d’Economie d’Orléans (LEO) pour assister à la conférence intitulée « Environmental Economics: A Focus on Natural Resources ». Le programme était vraiment sympa : https://sites.google.com/view/eenr-orleans/program.

Durant l’une des sessions, j’ai eu l’occasion de présenter la nouvelle version du modèle de cycles réels que nous avons développé avec Gauthier Vermandel. Ce modèle vise à estimer les effets de court terme des chocs climatique sur les cycles économiques, ainsi que les effets de long termes du changement climatique sur la volatilité macroéconomique et le bien-être. Le papier est disponible sur RePEc : Weather Shocks, Climate Change and Business Cycles

Cliquez sur le titre du billet pour l’afficher dans sa version complète et ainsi accéder au diaporama accompagnant ma présentation.

07mars/18

Démographie historique et données collaboratives

Généalogie de Victor Hugo

Il y a quelques mois, j’indiquais dans un billet du blog que j’avais présenté les débuts des travaux engagés avec Arthur Charpentier au sujet de la démographie historique à partir de données collaboratives issues du site geneanet.org. J’avais également fait part de l’avancée des recherches lors d’une matinée d’exposés avec les membres de la chaire Actinfo (c.f. billet). Aujourd’hui, Arthur et moi avons déposé un document de travail intitulé « Étude de la démographie française du XIXe siècle à partir de données collaboratives de généalogie » sur HAL.

Dans ce papier, nous explorons un jeu de données de 2,45 millions d’individus, correspondant à des personnes nées entre 1800 et 1804 en France ainsi qu’à leurs descendants sur 3 générations. Les données brutes étaient gigantesques : plus de 700 000 000 de lignes. Chaque ligne représente un événement (naissance, mariage ou décès) pour un individu dans l’arbre d’un utilisateur de geneanet.org. Or, comme chaque utilisateur créé son propre arbre (il faut noter que nous n’avons pas accès aux arbres des utilisateurs n’ayant pas souhaité le rendre public), les individus se retrouvent dupliqués dans la base. Un gros travail d’appariement et de nettoyage des arbres a donc été réalisé et a conduit à ce nombre de 2,45 millions d’individus.

28févr./18

Communes proches avec R

Rennes

Dans mes travaux actuels, j’ai besoin d’identifier pour une commune en particulier, quelles sont les autres communes proches, pour un rayon donné de 20km. Pour obtenir une telle information, je me suis appuyé sur les données de communes d’Open Street Map. L’idée est simple :

  • récupérer les frontières des communes ;
  • les étendre ;
  • regarder quelles communes sont en intersection avec les frontières étendues.
19sept./17

Matinée d’exposés – COVEA

Covéa

En ce mardi 19 septembre, je prends le train (tôt) à destination de Paris pour participer à la matinée d’exposés avec les gens de la Chaire Actinfo dont je suis maintenant membre, pendant la durée de mon post-doc avec Arthur Charpentier.

Je vais présenter le travail effectué cet été sur les données collaboratives de généalogie. Ce sera l’occasion de parler de l’orientation vers laquelle Arthur et moi comptons suivre pour mener nos recherches liées à ces données.

Ce sera aussi l’occasion d’assister à la présentation des travaux d’Olivier Wintenberger.

06sept./17

Conférence GEOMED 2017 à Porto (Portugal)

Porto 2017

Cette semaine, je vais assister à la conférence GEOMED2017 à Porto, au Portugal. Cette conférence réunit des chercheurs issus de différentes disciplines qui travaillent sur les statistiques spatiales, l’épidémiologie spatiale et la santé publique. Ce sera l’occasion d’assister à de nombreuses présentations pendant trois jours (et un jour supplémentaire durant lequel un workshop est proposé par Lee Duncan de l’Université de Glasgow, sur la modélisation des données spatiales sur R avec le package CARBayes).

18janv./17

Is Big Data Good or Evil?

Flyer Eco clubHier, avec Arthur Charpentier (@freakonometrics), nous avons rejoint le club d’éco à l’institut franco-américain (@IFArennes). Nous avions été invité par Alice Bernard pour parler avec les membres du club du Big Data. Les discussions avec les membres étaient enrichissantes !

Les slides projetées pendant la présentation sont disponibles à l’intérieur du billet.

17nov./16

Mais où est Charlie ?


Hier, j’ai parcouru un article amusant de Randal S. Olson, intitulé « Here’s Waldo: Computing the optimal search strategy for finding Waldo« . Bon, ce n’est rien de nouveau, je sais, j’arrive un peu en retard, ça date de 2015. Quoi qu’il en soit, j’ai voulu apporter mon petit grain de sable au contenu proposé par Randal. Dans son billet, il explique qu’il a passé son week-end à chercher une stratégie optimale pour trouver Charlie. Vous savez, ce petit personnage en pull rayé rouge et blanc, avec un bonnet à pompom sur la tête. Pour ce faire, Randal a utilisé des techniques de machine learning. Il s’appuie sur une image publiée par Slate (Here’s Waldo, 2013, par Ben Blatt), qui répertorie la position de Charlie dans 68 double pages des albums. Randal extrait les coordonnées de l’image (et les partage gentiment).

[…]