Cette fiche de travail vise à présenter R Markdown, un environnement de travail permettant de créer des documents en data science.
Dans un unique fichier R Markdown, il est possible d’écrire du code et de l’exécuter, puis de produire des rapports (mêlant textes, codes, et résultats des évaluations des codes) visant à être partagés. Les codes peuvent être du R, mais pas uniquement : il est possible d’évaluer des instructions d’autres langages tels python ou SQL, entre autres. Les formats de sortie possible sont nombreux. Parmi les plus utilisés : html, pdf, Word, notebook, ioslides.
Le package {rmarkdown} peut être installé à l’aide de l’instruction suivante.
install.packages("rmarkdown")
Le document de référence principal sur lequel s’appuie cette fiche est l’ouvrage R Markdown Cookbook, rédigé par Yihui Xie, Christophe Dervieux et Emily Riederer (Chapman & Hall/CRC, 2020). Une version électronique est disponible gratuitement à l’adresse suivante : https://bookdown.org/yihui/rmarkdown-cookbook/.
Une antisèche de deux pages sur le R Markdown a été réalisée par RStudio : https://www.rstudio.com/wp-content/uploads/2015/02/rmarkdown-cheatsheet.pdf.
Pour conserver la prise de bonnes habitudes initiée lors des premières séances, créez dans un premier temps un projet RStudio, en respectant l’arborescence présentée sur l’image ci-dessous.
Création d’un projet
Dans RStudio :
File
, puis sur New Project...
.New Directory
, puis sur New Project
.Browse...
Open
.Create Project
pour créer le projet. Une nouvelle session RStudio s’ouvre alors. Le répertoire courant devient celui dans lequel vous avez créé le projet. Un fichier d’extention .Rproj
a été créé dans ce répertoire. Il suffira d’ouvrir ce fichier à l’avenir pour ouvrir RStudio pour travailler sur ce projet.Sur les ordinateurs de l’Université, vous veillerez à créer le projet dans le dossier C:/Workout
. La compilation sur les VDI (virtual desktop infrastructure) semble être impossible pour le moment.
Attention : à la fin de la séance, il faudra penser à copier/coller l’ensemble du répertoire contenant votre projet dans votre dossier Documents
. Les contenus du dossier C:/Workout
sont effacés à la fermeture de session.
À présent que le projet est créé, il est temps de créer un document R Markdown.
Création d’un document R Markdown
Dans RStudio :
Cliquez sur le menu File
, puis sur New File...
.
Cliquez sur R Markdown...
.
Dans la fenêtre qui s’affiche :
HTML
pour que le rapport qui sera créé après soit un document html (langage conçu pour présenter des pages web).OK
.Sauvegardez le fichier créé en lui donnant le nom de votre choix (par exemple : `premier_rapport.Rmd``).
Un document R Markdown, dont l’extension est .Rmd
est alors créé. Ce document est composé de trois parties :
Dans le document que vous venez de créer, l’en-tête YAML indique :
title: "Mon premier document R Markdown"
author: "Ewen Gallic"
date: "2/7/2022"
output: html_document
Le titre du document, l’auteur et la date sont précisés dans cette en-tête. Lors de la conversion du fichier Rmd en fichier html par Pandoc (un logiciel de conversion de documents), ces informations seront stockées dans des variables et apparaîtront à un ou plusieurs endroits du fichier html (selon le modèle – template – utilisé). La ligne output: html_document
indique quant à elle que le document de sortie sera un document html. D’autres éléments peuvent être indiqués, notamment dans la partie output
: présence d’une table des matières, numérotation des sections, ajout d’une feuille de style, etc.
En quelques mots, les étapes de conversion sont les suivantes :
knit()
du package {knitr
} exécute les codes contenus dans les chunks et prépare un fichier Markdow (.md
).md
dans un format de sortie (html, pdf, etc.)Si le format de sortie est le pdf, une étape supplémentaire est ajoutée : le fichier .md
est converti en un fichier LaTeX (.tex
). Une compilation du fichier .tex
est alors effectuée par LaTeX pour obtenir le fichier pdf final. Cela nécessite de fait d’installer LaTeX ou TinyTeX sur son système.
Dans le cadre de ce cours, nous ne produirons pas de documents au format html sur les ordinateurs de l’Université.
Pour ajouter une table des matières dans un fichier html, on ajoute des paires de clés-valeurs :
toc: yes
: on désire la création d’une table des matières (table of contents) ;toc_depth: 3
: l’entier donné en valeur définit la profondeur de la table des matières (1 : uniquement les sections, 2 : sections et sous-sections, 3 : sections, sous-sections et sous-sous sections, etc.)toc_float: true
: la table des matières sera insérée comme objet flotant et visible en permanence tout le long du document.---
title: "Mon premier document R Markdown"
author: "Ewen Gallic"
date: "2/7/2022"
output: html_document:
toc: yes
toc_depth: 3
toc_float: true
---
Attention, il faut respecter les indentations, comme dans l’exemple précédent.
Pour une table des matières sur un document final en pdf, le YAML doit contenir les paires toc: yes
et toc_depth:3
.
---
title: "Mon premier document R Markdown"
author: "Ewen Gallic"
date: "2/7/2022"
output: pdf_document:
toc: yes
toc_depth: 3
---
Le fichier .Rmd
peut contenir du texte que l’on rédige en markdown. Davantage d’informations seront données dans la suite de cette fiche concernant la syntaxe markdown (qui est très simple).
Les morceaux de code contiennent deux parties :
Pour être exécuté, le code fait appel à un environnement (dans lequel des variables peuvent être créées). Cet environnement peut être modifié après l’exécution du code.
Pour compiler un document R Markdown, une fois le YAML bien spécifié, il suffit au choix :
d’appeler la fonction render()
du package {rmarkdown
} :
Rmd
via l’argument input
: rmarkdown::render(input = "votre_document_rmarkdown.Rmd")
de cliquer sur le bouton Knit
(on le repère facilement avec son icone d’aiguille à tricoter et sa pelote de laine) ;
d’appuyer simultanément sur les touches du clavier Ctrl / Cmd + Shift + K
.
Les deux dernières solutions conduisent à un affichage du résultat dans une fenêtre qui s’ouvre à l’issue de la compilation.
Compilez votre premier fichier R Markdown avec l’une des trois manières indiquées, puis regardez le résultat.
Les parties textuelles qui permettent d’ajouter une narration aux rapports peuvent être rédigées en markdown. La sytaxe est très simple.
Il suffit d’écrire comme dans un bloc note pour que le texte soit affiché dans le rapport final.
Terminer une ligne par deux espaces permet d’aller à la ligne.
Laisser une ligne vide entre deux textes permet de créer un nouveau paragraphe.
Style | Syntaxe | Exemple | Rendu |
---|---|---|---|
Gras | ** ** ou __ __ |
Du texte **en gras** |
Du texte en gras |
Italique | * * ou _ _ |
Un mot en *italique* |
Un mot en italique |
Barré | ~~ ~~ |
J'~~aime~~ adore R |
J’ |
Une partie en italique dans du gras | **- -** |
Un **texte _très_ important** |
Un texte très important |
Tout en gras et italique | *** *** |
***新年快樂*** (Xin nian kuai le) |
新年快樂 (Xin nian kuai le) |
Exposant | ^ ^ |
Le 1^er^ janvier |
Le 1er janvier |
Il existe six niveaux de titres dans les documents R Markdown. On fait précéder le texte du titre par autant de croisillons (#
) que de niveau désiré.
# Titre de niveau 1
## Titre de niveau 2
### Titre de niveau 3
#### Titre de niveau 4
##### Titre de niveau 5
###### Titre de niveau 6
Notes :
Pour effectuer une citation dans un bloc, il convient de faire précéder la citation du symbole >, que l’on place en début de ligne. Exemple avec> chúc mừng năm mới
:
chúc mừng năm mới
Pour faire en sorte qu’une citation comporte plusieurs paragraphes, un chevron (>
) doit être ajouté au début de lignes vides.
> “How can two people hate so much without knowing each other?”
>
> --- Alan Moore, _The Killing Joke_
“How can two people hate so much without knowing each other?”
— Alan Moore, The Killing Joke
Pour insérer un tiret long (cadratin), on utilise trois tirets : ---
; pour un tiret court (ou demi-cadratin), on utilise deux tirets : --
.
Symbole voulu | Syntaxe | Exemple | Rendu | |
---|---|---|---|---|
Tiret long (cadratin) | --- |
--- une réplique |
— une réplique | |
Tiret moyen (demi-cadratin) | -- |
La frontière France--Italie |
La frontière France–Italie |
En inscrivant trois tirets ---
et en passant immédiatement à la ligne, une ligne horizontale est insérée.
Pour écrire des points de suspension, il suffit d’écrire trois points (...
) à la suite…
La création d’un lien hypertexte se fait en utilisant deux éléments : un texte sur lequel on clique, qui doit être entouré par des crochets []
et une adresse vers laquelle le lien point, qui doit être entourée par des parenthèses (()
).
[vidéo épatante](https://www.youtube.com/watch?v=dQw4w9WgXcQ). Regardez cette
Regardez cette vidéo épatante.
Pour créer un lien sans définir de texte spécifique en remplacement de l’URL, il est possible de simplement écrire l’URL. Il est toutefois préférable d’encadrer l’URL par des chevrons. Il en va de même pour une adresse email.
<https://www.youtube.com/watch?v=oavMtUWDBTM>
<ewen.gallic@univ-amu.fr>
https://www.youtube.com/watch?v=oavMtUWDBTM
ewen.gallic@univ-amu.fr
Pour créer une ancre (un lien vers un endroit précis de la page déjà affichée) vers un titre du document, il faut connaître la référence vers le point d’ancrage. Un moyen simple consiste à la définir soi-même, en utilisant la syntaxe suivante :
# Le titre {#nom-de-la-reference}
Le nom de la reference ne doit pas contenir d’espaces ni de traits de soulignement (_
). Il peut en revanche, comme dans l’exemple, contenir des tirets (-
).
Dans ce document, la sous section dans laquelle ce texte est inscrit, est définie comme suit :
## Liens hypertextes {#liens-hypertextes}
[section](#liens-hypertextes). On peut ainsi facilement faire un lien vers cette
On peut ainsi facilement faire un lien vers cette section.
L’insertion de notes de bas de page numérotées s’effectue à l’aide de crochets ([]
) contenant un accent circonflèxe et une référence qui peut être soit un nombre, soit un texte (mais sans espace ou autre caractère blanc).
Le numéro de la note de bas de page est un lien qui renvoie vers la note. Une flèche de retour est proposée pour ramener au texte lorsque le document créé est un document html.
[^1] suivie d'une note plus longue[^longue-note].
Une note de bas de page simple
[^1]: la note de bas de page.
[^longue-note]: une note de bas de page plus longue.
Dans laquelle on peut écrire un paragraphe.
`{ du code }`
Plusieurs paragraphes, même.
Une note de bas de page simple1 suivie d’une note plus longue2.
On distingue deux types de listes : les listes ordonnées et les listes non ordonnées.
Pour créer une liste ordonnée, on place en début de ligne, devant chaque élément de la lique, un nombre immédiatement suivi d’un point et d’une espace.
1. Un premier élément ;
2. Un deuxième élément ;
3. Un troisième élément.
Il n’est pas nécessaire de respecter la numérotation :
1. Un premier élément ;
10. Un deuxième élément ;
5. Un troisième élément.
Le numéro du premier élément de la liste ordonnée définit la valeur du compteur :
4. Un premier élément ;
10. Un deuxième élément ;
5. Un troisième élément.
Pour insérer une liste non ordonnée, on fait précéder chaque élément du symbole -
ou du symbole *
.
Une liste comprenant :
* un premier élément ;
* un deuxième élément ;
* un troisième élément.
Une liste comprenant :
Pour ajouter une liste à l’intérieur d’une liste, il faut ajouter avant le tiret ou l’étoile soit un taquet de tabulation, soit 4 espaces.
- un premier élément ;
- un deuxième élément :
- qui contient un sous-élement,
- ainsi qu'un deuxième sous-élément,
- et un troisième ;
- puis un troisième élément.
Pour écrire un paragraphe à l’intérieur d’une liste, une identation (taquet de tabulation ou 4 espaces) doit être ajoutéé, pour préserver la continuité de la liste. Il faut également faire précéder le paragraphe d’une liste vide (on peut aussi ajouter une ligne vide après le paragraphe, mais celle-ci est optionnelle).
- un premier élément ;
- un deuxième élément :
qui contient un paragraphe.
- puis un troisième élément.
un premier élément ;
un deuxième élément :
qui contient un paragraphe.
puis un troisième élément.
Il est tout à fait possible d’imbriquer une liste ordonnée dans une liste non ordonnée et vice-versa.
1. Un premier élément :
- avec un sous-élément ;
2. Un deuxième élément.
Règles de typographie :
En français, les listes sont généralement introduites par une phrase se terminant par deux tirets (:
). Les éléments de la liste ne commencent alors pas par une majuscule. Les éléments sont séparés par un point virgule (;
), et le dernier élément se termine par un point.
Une liste comprenant :
Lorsque la liste est numérotée, il faut en revanche mettre une majuscule à chaque élément de la liste
Une liste comprenant :
Lorsqu’une liste se compose de plusieurs phrases, chaque élément commence par une majuscule et se termine par un point.
Les personnes pouvant postuler :
Pour les personnes ayant validé une Licence 2 mention “Économie-Gestion” à Aix-Marseille Université ou dans une autre Université française : entrée de droit dans le parcours.
Pour les personnes ayant validé un niveau équivalent à la Licence 2 en Économie ou en Économie-Gestion (Licence 2 mention Économie, DUT, CPGE, etc.) : une commission pédagogique évalue les dossiers notamment sur la base des pré-requis mentionnés plus haut ainsi que sur la base des projets de Master des étudiantes et étudiants.
les règles de typographie françaises indiquent qu’il est d’usage de placer un point virgule à la fin des éléments de niveau 1 ou au dernier élément de niveau supérieur à 1 si celui-ci est immédiatement suivi par un élément de niveau 1 ;
pour les éléments de niveau 2, une
En cas de listes imbriquées, la virgule est utilisée en fin de ligne, sauf pour le dernier élément de la liste imbriquée qui lui, s’achève par un point virgule ou un point s’il s’agit du dernier élément de la liste.
Une liste qui comprend :
un élément de niveau 1
un autre élément de niveau 1 :
un troisième élément de niveau 1.
L’ajout d’une image se fait en insérant un point d’exclamation (!
), suivi d’une d’un titre entre crochets, puis du chemin vers l’image, entre parenthèses (()
). Une description de l’image peut être ajoutée entre guillemets (""
) après le chemin, toujours dans les parenthèses (cette description est visible au survol de l’image, lorsque le pointeur de la souris reste quelques secondes au-dessus de l’image, et peut être lue à voix haute par les systèmes destinés aux personnes en situation de handicap). Enfin, pour spécifier des paramètres de taille de l’image, il est possible d’ajouter des informations entre crochets ({}
).
![Un tigre](figs/tigre.JPG "Tigre en papier"){width="200px"}
La création d’un tableau se fait en distinguant l’en-tête du corps du tableau. Chaque cellule est séparée à l’aide d’une barre verticale (|
, Alt gr + 6
sur un clavier azerty sous Windows, et Alt + Shift + L` sur Mac Os). On ajoute des barres verticales au début et à la fin de chaque ligne du tableau. Pour délimiter l’en-tête du corps du tableau, trois tirets ou plus doivent être placés entre les barres verticales.
| Première colonne | Deuxième colonne | Troisième colonne |
| ---------------- | ---------------- | ----------------- |
| cellule 1, ligne 1 | cellule 2, ligne 1 | cellule 3, ligne 1 |
| cellule 1, ligne 2 | cellule 2, ligne 2 | cellule 3, ligne 2 | | cellule 1, ligne 3 | cellule 2, ligne 3 | cellule 3, ligne 3 |
Première colonne | Deuxième colonne | Troisième colonne |
---|---|---|
cellule 1, ligne 1 | cellule 2, ligne 1 | cellule 3, ligne 1 |
cellule 1, ligne 2 | cellule 2, ligne 2 | cellule 3, ligne 2 |
cellule 1, ligne 3 | cellule 2, ligne 3 | cellule 3, ligne 3 |
La gestion de l’alignement des colonnes se fait à l’aide de la deuxième ligne, celle composée des tirets. Pour un alignement à gauche, on ajoute deux points (:
) à gauche des tirets, pour un alignement à droite, on ajoute ces deux points à droite des tirets, et pour une colonne centrée, on ajoute les deux points à la fois à gauche et à droite.
| Colonne alignée à gauche | Colonne centrée | Colonne alignée à droite |
| :---------------- | :----------------: | -----------------: |
| cellule 1, ligne 1 | cellule 2, ligne 1 | cellule 3, ligne 1 |
| cellule 1, ligne 2 | cellule 2, ligne 2 | cellule 3, ligne 2 | | cellule 1, ligne 3 | cellule 2, ligne 3 | cellule 3, ligne 3 |
Colonne alignée à gauche | Colonne centrée | Colonne alignée à droite |
---|---|---|
cellule 1, ligne 1 | cellule 2, ligne 1 | cellule 3, ligne 1 |
cellule 1, ligne 2 | cellule 2, ligne 2 | cellule 3, ligne 2 |
cellule 1, ligne 3 | cellule 2, ligne 3 | cellule 3, ligne 3 |
Il est possible d’utiliser du LaTeX pour écrure des équations mathématiques en Markdown. On distingue deux types de formules :
$equation$
)$$equation$$
). Les formules en ligne, $f(x)=x^2+3x+4, x\in\mathbb{R}$, permettent d'insérer des formules dans un paragraphe, tandis que les formules en mode _display_ permettent d'insérer des formules dans un bloc à part $$X\sim\mathcal{N}(0,1).$$
Les formules en ligne, \(f(x)=x^2+3x+4, x\in\mathbb{R}\), permettent d’insérer des formules dans un paragraphe, tandis que les formules en mode display permettent d’insérer des formules dans un bloc à part \[X\sim\mathcal{N}(0,1).\]
Une antisèche réalisée par Jim Hefferon, permettant de rédiger des formules en LaTeX est disponible sur le réseau complet d’archives TeX (CTAN) : http://tug.ctan.org/info/undergradmath/undergradmath.pdf.
Pour présenter du code, il existe deux manières en RMarkdown : soit des codes en ligne, directement insérés dans le texte, soit des blocs de code. Pour écrire des codes en ligne, on écrit le code entre deux accents graves (` `
, Alt gr + 7
sur un clavier azerty sous Windows, touche `
sous Mac Os). Si on désire avoir une coloration syntaxique, il faut de surcroît indiquer le langage entre crochets ({}
), après un point ({.nom-du-langage}
) :
`mean(x)`{.R} permet de calculer la moyenen de `x`.
La fonction `SELECT * FROM base`{.SQL} permet de récupérer l'ensemble des colonnes de la base `base` en SQL. L'instruction
La fonction mean(x)
permet de calculer la moyenen de x
.
L’instruction SELECT * FROM base
permet de récupérer l’ensemble des colonnes de la base base
en SQL.
Pour insérer des blocs de code, on utilise trois accents grave (```
) avant et après le code :
```
x <- mean(ventes$Sales, na.rm=TRUE)
```
Ce qui produira :
x <- mean(ventes$Sales, na.rm=TRUE)
À nouveau, si le langage du code contenu dans le bloc est spécifié, on obtient une coloration syntaxique. Le nom du langage est donné immédiatement après les trois accents graves.
```r
<- mean(ventes$Sales, na.rm=TRUE)
x ```
Donnera :
<- mean(ventes$Sales, na.rm=TRUE) x
Les codes et blocs de codes rédigés dans la section “Codes et blocs de code” ne sont jamais exécutés. Un des intérêts du RMarkdown réside dans la possibilité d’évaluer des codes (nous n’exécuterons ici que du R, mais il est possible d’exécuter d’autres langages dans un ficher RMarkdown), de les afficher, et d’afficher les résultats et sorties résultants de l’évaluation.
À nouveau, on peut distinguer deux types de codes : ceux en ligne et les blocs ou chunks de code.
Les codes en ligne sont délimités avec un accent grave au début et un à la fin, comme en markdown. La seule différence est que le nom du langage figure immédiatement après le premier accent grave. Le code ne sera pas retourné, seul son résultat apparaîtra dans le document final. Prenons un exemple simple.
`r mean(c(20, 18, 15, 16))`. La moyenne des notes est de
La moyenne des notes est de 17.25.
Pour insérer des blocs de code, on utilise comme en markdown les trois accents graves avant et après le code. On fait suivre le troisième accent grave du début par le nom du langage, entre crochets ({r}) :
```{r}
x <- c(20, 18, 15, 16)
x
```
Le résultat est le suivant :
<- c(20, 18, 15, 16)
x x
## [1] 20 18 15 16
On note que par défaut, le code est présent dans le document final ainsi que le résultat de son évaluation (tel qu’affiché dans la console).
Note : nous venons de créer l’objet x
dans l’environnement. Nous pouvons le réutiliser dans un nouveau code, qu’il soit en ligne (`r `
) : 20, 18, 15, 16 ou dans un chunk (```{r} ```
):
```{r}
x
```
qui donne ensuite :
x
## [1] 20 18 15 16
Note : pour insérer un chunk, on peut utiliser le raccourci Ctrl + Alt + I
sous Windows ou bien cmd + alt/option + I
sous Mac Os.
Lorsqu’on définit un chunk, il est possible d’ajouter de nombreuses options qui auront un impact sur le fonctionnement du chunk. Par exemple, on peut demander d’afficher le code sans l’exécuter, d’afficher le résultat en masquant le code, ou bien de contrôler les paramètres d’affichage des figures si le code en produit. Il existe plus de 50 paramétrages. La liste est disponible sur le site du créateur du package {knitr
} : https://yihui.org/knitr/options/.
La syntaxe est la suivante :
```{r, options}
code
```
Une bonne pratique consiste à attribuer un identifiant unique à chaque chunk.
```{r identifiant-du-chunk, options}
x
```
Voici quelques options pratiques.
Syntaxe | Effet |
---|---|
include = FALSE |
Ni le code ni les éventuels résultats affichés dans la console n’apparaitront dans le document final. |
echo = FALSE |
Le code n’apparaîtra pas dans le résultat final, tandis que les résultats seront visibles. |
eval = FALSE |
Le code apparaîtra dans le document final mais ne sera pas exécuté. |
message = FALSE |
Les messages générés par l’excution du code n’apparaîtront pas dans le document final. |
warning = FALSE |
Les messages d’avertissement générés par l’excution du code n’apparaîtront pas dans le document final. |
fig.cap = "titre" |
Si le code produit une image, le titre indiqué entre les guillemets sera utilisé comme titre de la figure |
fig.width = "2" , figh.height="4 |
Si le code produit une image, permet de définir sa largeur et sa hauteur, respectivement. Les valeurs sont données en pouces (inches). |
out.width='50%' , out.height='75%' |
Si le code produit ou affiche une image, permet de définir, en pourcentages, la taille de l’image. |
Voici un exemple avec une image :
```{r plot-iris, out.width='75%', fig.cap = "Largeur des sépals en fonction de leur longueur."}
plot(iris$Sepal.Length, iris$Sepal.Width)
```
Ce qui donne :
plot(iris$Sepal.Length, iris$Sepal.Width)
Le paramétrage de l’ensemble des chunks est réglé par une liste (knitr::opts_chunk
). En modifiant les valeurs de cette liste comme dans l’exemple ci-dessous, et en plaçant cette instruction dans un chunk positionné juste après l’en-tête en YAML, tous les chunks adopteront le comportement spécifié.
Dans l’exemple ci-dessous, tous les codes des chunks seront visibles (echo = TRUE
), les messages et les avertissements retournés lors de l’exécution des codes seront masqués (message = FALSE
et warning = FALSE
), les figures produites en R seront centrées (fig.align = "center"
)
```{r chunks-settings, echo=FALSE, include=TRUE, message=FALSE, warning=FALSE}
knitr::opts_chunk$set(echo = TRUE,
message = FALSE,
warning = FALSE,
fig.align = "center")
```
Note : le paramétrage du comportement général des chunks peut ensuite être modifié pour certains chunks spécifiques. Pour ce faire, il suffit d’ajouter dans les paramètres des chunks à modifier le comportement désiré. Par exemple, si echo = TRUE
est défini dans la liste des paramètres de la liste knitr::opts_chunk
, si on souhaite masquer le code d’un chunk spécifique, il suffit de lui ajouter l’option echo = FALSE
:
```{r, echo=FALSE}
# code du chunk
```
Lorsqu’un document RMarkdown comprend des calculs qui prennent beaucoup de temps à s’effectuer lors de la compilation, il est possible de mettre en cache les résultats de tout ou partie des chunks. Pour ce faire, il suffit d’indiquer le paramètre cache = TRUE
dans le ou les chunks que l(on souhaite mettre en cache.
Lors de la compilation du document, les chunks ayant été mis en cache ne seront pas exécutés par {knitr
} s’ils ont été exécutés lors de la précédente compilation et qu’aucune modification ne leur a été apportée. Si le code à l’intérieur d’un chunk a été modifié entre le moment où il a été exécuté par {knitr
} lors d’une compilation et une nouvelle compilation (ou si un paramètre du chunk autre que include
a été modifié), alors il sera de nouveau réévalué et remis en cache.
Il est risqué de paramétrer l’ensemble des chunks de sorte qu’ils soient tous mis en cache. Si le je chunks est modifié, il sera réévalué par {knitr
} lors de la compilation. Or, si l’évaluation dépend de variables définies avant le je chunk mais ayant été modifiées après, les résultats retournés par la nouvelle évaluation du je chunk risquent de ne pas être reproductibles…
Il est parfois utile de vider le cache pour éviter les erreurs mentionnées précédemment. Pour ce faire, on peut cliquer sur la flèche pointant vers le bas située à droite du bouton Knit
, puis cliquer sur la ligne commençant par l’emoji balais Clear Knitr Cache...
.
Note : la mise en cache est surtout utile lordque l’on charge des résultats d’estimation de modèles longs à calculer (des modèles de machine-learning par exemple).
Citer une source répond à des normes. Une des normes fréquemment rencontrées en économie est celle de l’association américaine de psychologie (American Psychological Association). Elle reprend l’acronyme de l’association : APA.
Des explications en français sur ces normes sont proposées sur le site des bibliothèques de l’Université de Montréal à l’adresse suivante https://bib.umontreal.ca/citer/styles-bibliographiques/apa.
On distingue deux manières de citer des références : dans le texte et en bibliographie.
Avec RMarkdown, nous n’avons qu’à nous soucier de la citation dans le texte. L’ajout des références citées en bibliographie se fait ensuite automatiquement, en respectant la norme utilisée. Pour cela, il faut :
Un fichier de bibliographie au format .bib
(BibTeX) doit dans un premier temps être créé. Ce fichier contient les références, formatées selon le standard attendu des fichiers bib. Sur le site bibtex.com, la page suivante propose un guide sur les formats BibTeX. https://www.bibtex.com/g/bibtex-format/.
Chaque entrée dans le fichier BibTeX correspons à une référence bibliographique. Elle est composée de trois parties :
Prenons un exemple :
@book{xie_2018_rmarkdown,
title={R markdown: The definitive guide},
author={Xie, Yihui and Allaire, Joseph J and Grolemund, Garrett},
year={2018},
publisher={Chapman and Hall/CRC}
}
Il s’agit d’un livre, donc le type de document est indiqué à l’aide de @book
. La référence unique est xie_2018_rmarkdown
, et les paires de clés-valeurs sont renseignées dans une liste où chaque clé est donnée avant le symbole égal et chaque valeur est donnée après le symbole égal. Les paires sont séparées par une virgule.
À votre tour : créez un nouveau fichier de script R dans RStudio. Dans ce fichier, collez l’entrée bibliographique du livre de Yihui Xie et al. Enregistrez le document en le nommant biblio.bib
.
Il vous sera demandé si vous souhaitez changer l’extension du fichier pour effectivement utiliser .bib
plutôt que .R
: dites oui.
Afin d’éviter de devoir rédiger à la main l’ensemble des entrées du fichier BibTeX, il existe de nombreux outils pour nous faciliter le travail. Nous allons en voir quelques-uns.
Dans un premier temps, on peut vérifier si la référence existe sur Crossref. Ce site est très pratique pour obtenir des citations généralement propres, mais il a un inconvénient : il faut parfois être patient, le site rencontre fréquemment des erreurs 500 (Internal Server Error).
Essayons de chercher la référence pour l’article de Susan Athey intitulé “The State of Applied Econometrics: Causality and Policy Evaluation”, publié dans “The Journal of economic perspectives” (JEP) en 2017.
Après avoir cliqué sur le bouton “Search metadata”, on peut coller le titre de l’article : The State of Applied Econometrics: Causality and Policy Evaluation
, puis lancer la recherche en appuyant sur la touche Enter
du clavier.
Parmi les références proposées, lorsqu’on a identifié celle qui correspond effectivement à celle que l’on recherche, on récupère les métadonnées en cliquant sur le lien Actions
puis sur Cite
.
L’entrée bibliographique au format BibTeX est alors affichée, il ne reste plus qu’à la copier et à la coller dans notre fichier bib.
À votre tour : recherchez la référence de l’article de Susan Athey publié dans le JEP en 2017 et collez l’entrée dans votre fichier BibTeX.
Votre fichier BibTeX doit à présent contenir deux entrées (n’oubliez pas de le sauvegarder) :
@book{xie_2018_rmarkdown,
title={R markdown: The definitive guide},
author={Xie, Yihui and Allaire, Joseph J and Grolemund, Garrett},
year={2018},
publisher={Chapman and Hall/CRC}
}@article{Athey_2017,
doi = {10.1257/jep.31.2.3},
url = {https://doi.org/10.1257%2Fjep.31.2.3},
year = 2017,
month = {may},
publisher = {American Economic Association},
volume = {31},
number = {2},
pages = {3--32},
author = {Susan Athey and Guido W. Imbens},
title = {The State of Applied Econometrics: Causality and Policy Evaluation},
journal = {Journal of Economic Perspectives}
}
Parfois, on ne trouve pas l’information désirée sur Crossref. Il peut alors être une bonne idée d’aller chercher sur Google Scholar si la référence existe. Pour l’heure, les références sur Google Scholar ont l’air d’être moins bien renseignées que sur Crossref.
Essayons de retrouver la référence du papier d’Olivier Deschênes et de Michael Greenstone publié dans l’American Economic Review (AER) en 2007. Cherchons le papier par son titre :
The economic impacts of climate change: evidence from agricultural output and random fluctuations in weather
Une fois l’article identifié dans les résultats, il suffit de cliquer sur le lien Citer
.
Une fenêtre surgit. Les citations pré-formatées selon différents styles sont données. Pour récupérer les métadonnées au format BibTeX, il faut cliquer sur le lien BibTeX
.
Les métadonnées s’affichent dans une page web. Il ne reste plus qu’à effectuer un copier/coller dans le fichier BibTeX.
À votre tour : recherchez la référence de l’article d’Olivier Deschênes et de Michael Greenstone publié dans l’AER en 2007 et collez l’entrée dans votre fichier BibTeX.
Votre fichier BibTeX doit à présent contenir trois entrées (n’oubliez pas de le sauvegarder) :
@book{xie_2018_rmarkdown,
title={R markdown: The definitive guide},
author={Xie, Yihui and Allaire, Joseph J and Grolemund, Garrett},
year={2018},
publisher={Chapman and Hall/CRC}
}@article{Athey_2017,
doi = {10.1257/jep.31.2.3},
url = {https://doi.org/10.1257%2Fjep.31.2.3},
year = 2017,
month = {may},
publisher = {American Economic Association},
volume = {31},
number = {2},
pages = {3--32},
author = {Susan Athey and Guido W. Imbens},
title = {The State of Applied Econometrics: Causality and Policy Evaluation},
journal = {Journal of Economic Perspectives}
}@article{deschenes2007economic,
title={The economic impacts of climate change: evidence from agricultural output and random fluctuations in weather},
author={Desch{\^e}nes, Olivier and Greenstone, Michael},
journal={American economic review},
volume={97},
number={1},
pages={354--385},
year={2007}
}
Si jamais la référence que l’on cherche n’est disponible ni sur le site du journal ou de l’éditeur, ni sur crossref, ni sur Google Scholar, il reste la possibilité d’utiliser un générateur de citations comme celui proposé sur ce site : https://www.bibme.org/bibtex. Il est également évidemment possible de rentrer l’ensemble des informations à la main (mais gare aux erreurs !).
Une fois le fichier BibTeX créé, il faut renseigner dans l’en-tête YAML (en-tête de métadonnées) :
biblio.bib
se trouve dans le même répertoire que le fichier RMarkdown) ;---
output: html_document
bibliography: biblio.bib
biblio-style: apalike
link-citations: yes
---
Nous disposons à présent d’un fichier BibTeX contenant 3 entrées, l’en-tête du document RMarkdown précise où se situe ce fichier d’entrées bibliographiques. Reste à présent à citer les entrées dans le texte.
Pour citer un document, on doit utilise son identifiant unique que l’on place entre crochets, après un symbole arobase : [@identifiant]
.
Description | Syntaxe | Affichage dans le texte |
---|---|---|
Citation entre parenthèses | [@xie_2018_rmarkdown] |
(Xie, Allaire, and Grolemund 2018) |
Supprimer la mention de l’auteur | [-@xie_2018_rmarkdown] |
(2018) |
Ajout d’informations supplémentaires | [voir @xie_2018_rmarkdown, pp. 10--12] |
(voir Xie, Allaire, and Grolemund 2018, 10–12) |
Citation multiple | [@xie_2018_rmarkdown;Athey_2017] |
(Xie, Allaire, and Grolemund 2018; Athey and Imbens 2017) |
Citation sans les parenthèses pour les auteurs | @xie_2018_rmarkdown |
Xie, Allaire, and Grolemund (2018) |
La bibliographie à la fin du document sera automatiquement ajoutée. On peut placer une section # Références
à la fin du document pour faire une rupture avec la section précédente. Cette section ne sera pas numérotée.