# 🧪 TD n°2 – Représentations graphiques et importation de données avec R (R1) --- ## 🎯 Objectifs du TD Ce TD a pour objectif de : - choisir une **représentation graphique adaptée** au type de données ; - produire des **graphiques statistiques** simples avec R ; - personnaliser les graphiques (titres, axes, couleurs) ; - interpréter **histogrammes**, **boîtes à moustaches** et **diagrammes en barres** ; - importer des données depuis des **fichiers CSV** ; - réaliser une **exploration rapide** des données importées. --- ## 📌 Rappel : types de données et graphiques |Type de variable|Exemples|Graphiques adaptés| |---|---|---| |Quantitative|taille, note, âge|histogramme, boxplot| |Qualitative|couleur des yeux, mention|diagramme en barres| ⚠️ **Le choix du graphique dépend toujours du type de données.** --- ## 📊 Histogramme ### 🔹 Principe Un histogramme représente la **distribution** d’une variable quantitative. ### 🔹 Fonction `hist()` ```r hist(x, ...) ``` - `x` : vecteur numérique - paramètres usuels : - `main` : titre - `xlab`, `ylab` : axes - `col` : couleur - `breaks` : découpage des classes ### 🔹 Exemple ```r hist(NOTE_ETUDE[, "NOTE1"], breaks = seq(0, 20, 0.5), col = "red", main = "Fréquences des notes en programmation", xlab = "Notes", ylab = "Effectifs") ``` --- ## 🧪 Exercice 4 – Histogrammes À partir de l’objet `NOTE_ETUDE` : 1. Réaliser un histogramme des **notes de programmation**. 2. Réaliser un histogramme des **notes de marketing**. 3. Ajouter un **titre** et nommer les **axes**. --- ## 📦 Boîte à moustaches (boxplot) ### 🔹 Principe Le boxplot permet de visualiser : - la médiane, - les quartiles Q1 et Q3, - l’intervalle interquartile (IQR), - les valeurs aberrantes (_outliers_). ### 🔹 Fonction `boxplot()` ```r boxplot(x, ...) ``` ### 🔹 Lecture - minimum = Q1 − 1,5 × IQR - maximum = Q3 + 1,5 × IQR --- ## 🧪 Exercice 5 – Boxplot 1. Réaliser un **boxplot** des notes contenues dans `NOTE_ETUDE`. 2. Ajouter un titre et nommer les axes. --- ## 📊 Diagramme en barres ### 🔹 Principe Le diagramme en barres est adapté aux **variables qualitatives**. ### 🔹 Fonction `barplot()` ```r barplot(x, ...) ``` Arguments importants : - `names.arg` : étiquettes - `legend.text` : légende - `main`, `xlab`, `ylab` : titres - `col` : couleurs --- ### 🔹 Exemple simple ```r mention <- c("AB", "B", "AB", "P", "P", "B", "P", "TB") eff <- table(mention) barplot(eff, main = "Effectifs par type de mention", xlab = "Mention", ylab = "Effectifs", col = rainbow(4)) ``` --- ## 📊 Diagramme en barres empilées ### 🔹 Proportions ```r propligne <- proportions(eff, margin = 1) propcol <- proportions(eff, margin = 2) ``` - `margin = 1` : proportions en ligne - `margin = 2` : proportions en colonne ### 🔹 Exemple avec deux variables qualitatives ```r mention <- c("AB","B","AB","P","P","B","P","TB") couleursYeux <- c("b","v","m","b","b","n","m","b") df <- data.frame(mention, couleursYeux) eff <- table(df) propcol <- proportions(eff, margin = 2) barplot(propcol, main = "Proportions des mentions selon la couleur des yeux", ylab = "Proportions", col = rainbow(4), legend.text = TRUE) ``` --- ## 📥 Importer des données CSV ### 🔹 Fonctions principales ```r read.table() read.csv() read.csv2() ``` |Fonction|Séparateur|Décimal| |---|---|---| |`read.csv()`|`,`|`.`| |`read.csv2()`|`;`|`,`| --- ### 🔹 Exemple ```r exercice <- read.csv2("exercice1.csv", header = TRUE, row.names = 1) ``` Vérification : ```r str(exercice) ``` --- ## 🧪 Exercice 6 – Importation de données (CSV 1) 1. Importer le fichier `exercice1.csv`. 2. Vérifier la structure du tableau. 3. Calculer les effectifs avec `table()`. 4. Représenter graphiquement les données. --- ## 🧪 Exercice 7 – Importation de données (CSV 2) 1. Importer le fichier `exercice2.csv`. 2. Vérifier la structure avec `str()`. 3. Calculer la moyenne et les quartiles. 4. Choisir un graphique adapté. --- ## ✅ Exemple de corrigé – Exercice 7 ```r exercice2 <- read.csv2("exercice2.csv", header = TRUE, row.names = 1) str(exercice2) summary(exercice2) boxplot(exercice2, main = "Comparaison des rendements selon les traitements", ylab = "Rendement", col = c("red", "blue")) ``` --- ## 🔑 Points clés à retenir - Le **choix du graphique dépend du type de variable**. - `hist()` → variables quantitatives. - `boxplot()` → comparaison de distributions. - `barplot()` → variables qualitatives. - Les données CSV peuvent être importées facilement avec `read.csv()` et `read.csv2()`. - Toujours vérifier un jeu de données avec `str()` et `summary()`. --- ## 📜 Historique - Dernière mise à jour : `30 janvier 2026` - Rédigé par : [[Jizhen CAI]]