NLPWorkshop 14 sept 2023 : Grammaire des données et des graphiques
Pour cette première séance de l’année du NLP Workshop, on commence par les bases avec deux packages essentiels : dplyr
, pour traiter les données, et ggplot2
pour les visualiser. Les deux répondent à une grammaire que Wilkinson and Wills (2005) a systématisé pour les graphiques, et que Wickham et al. (2019) a empaqueté dans la suite tidyverse
.
On travaille avec l’environnement Quarto pour Rstudio qui reprend largement les conventions Rmarkdown.
Le but est de présenter la manière de travailler, pour des données complexes, avec ces deux packages et leur compagnons . Ce sera très pratique, pas trop pédagogique car on ira directement vers des exemples un peu compliqués afin de démontrer la versatilité de ce langage et ses finesses. On ne fera pas pour les débutants (à moins qu’ils étudient avant les références), mais pour les spécialistes !