Tag Archives: R_fr

06Jun/18

Coupe du Monde 2018: Paul the octopus is back

(Français) Fifa World Cup 2018

À l’occasion de l’Euro 2008 et du Mondial 2010, l’oracle d’Oberhausen (plus communément connu sous le nom de « Paul le poulpe ») a défrayé la chronique. Ses prévisions exactes concernant les résultats de l’équipe allemande lors de l’Euro 2008 et la désignation de l’équipe victorieuse du Mondial 2010 (l’Espagne) sont encore ancrées dans les mémoires. Avec quelques collègues (Enora Belz, Romain Gaté, Vincent Malardé et Jimmy Merlet) nous avons tenté de poursuivre le travail de feu Paul le poulpe pour prédire l’issue des rencontres à venir du Mondial 2018. Pour ce faire, nous nous appuyons sur les résultats des rencontres passées de coupe du Monde et de coupes Continentales1.

07Mar/18

Historical Demographics and Collaborative Data

Généalogie de Victor Hugo

A few month ago, I mentioned in a blog post that I had presented the beginnings of the work undertaken with Arthur Charpentier on historical demographics using collaborative data from a genealogy website, geneanet.org. I also reported on the progress of our research during some morning presentations with the members of the Actinfo Chair (see the blog post). Today, Arthur and I published a working paper on HAL untitled “Étude de la démographie française du XIXe siècle à partir de données collaboratives de généalogie” (French for “Nineteenth-century French demography from collaborative genealogy data”). The paper is written in French.

17Nov/16

Where’s Waldo? Here he is!


Yesterday, I came across a nice article untitled “Here’s Waldo: Computing the optimal search strategy for finding Waldo“, written by Randal S. Olson. I used the data he shared to apply a correction to the kernel density estimation of Waldo’s location.

In this article, Randal explains that he has devoted some time to try to compute the optimal search strategy for finding Waldo. To that end, he has used some machine learning techniques.
From an image provided by Slate (Here’s Waldo, 2013, by Ben Blatt), Randal S. Olson retrieved the coordinates of 68 different locations of Waldo, and kindly shared the data afterwards.

[…]

16Feb/15

Qui va gagner la Nouvelle Star ? À vos votes Twitter !

Cumul des votes par candidat au cours de la soirée

La chaîne de télévision D8 diffuse pour la troisième année consécutive l’émission Nouvelle Star. Si ma mémoire est bonne, je n’avais pas suivi ce programme depuis la saison 2006-2007, mais j’avoue m’être pris au jeu cette année, d’autant plus que la production propose une nouveauté par rapport aux saisons précédentes : les votes par Twitter !

Jeudi dernier, le 12/02, lors du quatrième prime, je me suis diverti avec l’API de Twitter pour récupérer les tweets postés pendant l’émission.

Les résultats de ma petite analyse laissent penser que les votes par SMS et par téléphone pratiqués durant l’émission ne sont pas négligeable, et ne reflètent pas exactement ce qui se dit sur le réseau social Twitter.

Aussi, après un bref rappel du déroulement des primes, ce billet présentera quelques observations réalisées autour des tweets extraits pendant l’émission de jeudi. Une troisième partie s’adressant à ceux désirant récupérer eux-même les tweets et effectuer leur propre analyse, fournira quelques codes R.

10Mar/14

[L3 Eco-Gestion] Régression linéaire avec R : sélection de modèle

Après avoir présenté rapidement la régression linéaire multiple avec R, et parlé un peu des problèmes de multicolinéarité, on va se pencher sur différentes techniques qu’il est possible d’employer pour sélectionner un modèle. Bien sûr, il en existe beaucoup d’autres. Le but est ici de donner un rapide aperçu.