Statistiques
Médiane, étendue, quartiles : Décrypter les données qui t'entourent !
Tu as déjà regardé les statistiques de tes jeux vidéo préférés ou les résultats d'un sondage sur ton artiste favori ? Ces chiffres racontent une histoire. Dans ce chapitre, nous allons apprendre à résumer et à comprendre une série de données avec des outils simples mais puissants. Tu vas découvrir comment trouver la valeur centrale, mesurer l'écart et repérer les grandes tendances. Prêt à devenir un expert en analyse de données ?
Objectifs du chapitre
- Savoir calculer la médiane d'une série statistique
- Comprendre et calculer l'étendue d'une série
- Déterminer les quartiles Q1 et Q3
- Interpréter ces indicateurs pour décrire une série de données
Le cours
La médiane : la valeur qui sépare en deux
La médiane est une valeur centrale qui partage une série de données ordonnées en deux groupes de même effectif. Cela signifie que la moitié des valeurs sont inférieures ou égales à la médiane, et l'autre moitié sont supérieures ou égales. Pour la trouver, la première étape est toujours de ranger les données dans l'ordre croissant, du plus petit au plus grand. Ensuite, on cherche la position de cette valeur centrale. La médiane est très utile car elle n'est pas influencée par les valeurs extrêmes, contrairement à la moyenne.
Exemple
Les notes de Léa en maths ce trimestre sont : 12, 8, 15, 11, 14. On les range : 8, 11, 12, 14, 15. Il y a 5 notes (effectif impair). La valeur centrale est la 3ème : 12. Donc la médiane est 12. La moitié de ses notes sont en dessous de 12, l'autre moitié au-dessus.
Formule
Pour une série de N valeurs ordonnées : - Si N est impair : Médiane = valeur au rang (N+1)/2 - Si N est pair : Médiane = moyenne des valeurs aux rangs N/2 et (N/2)+1
Astuce
Pense à la bande médiane sur l'autoroute : elle est au milieu et sépare les deux sens de circulation. La médiane, c'est pareil, elle est au milieu et sépare ta série en deux groupes égaux !
L'étendue : mesurer l'écart global
L'étendue est un indicateur très simple de la dispersion des données. Elle nous renseigne sur l'amplitude, c'est-à-dire l'écart entre la valeur la plus petite et la valeur la plus grande de la série. Une étendue faible signifie que les données sont regroupées, homogènes. À l'inverse, une étendue élevée indique que les valeurs sont très dispersées, hétérogènes. C'est un premier outil rapide pour évaluer la variabilité d'un ensemble.
Exemple
Reprenons les notes de Léa : 8, 11, 12, 14, 15. La plus petite note est 8, la plus grande est 15. L'étendue est donc 15 - 8 = 7. Cela signifie que l'écart entre sa meilleure et sa moins bonne note est de 7 points.
Formule
Étendue = Valeur maximale - Valeur minimale
Astuce
Étendue = Écart Total. Souviens-toi de l'initiale ! C'est l'écart entre les extrêmes. Pour la calculer, fais toujours MAX - MIN.
Les quartiles : Q1 et Q3, les autres séparatrices
Les quartiles permettent d'affiner l'analyse en découpant la série en quatre parties de même effectif. On en utilise principalement deux : le premier quartile (Q1) et le troisième quartile (Q3). Q1 est la valeur qui sépare les 25% des données les plus basses du reste. Q3 est la valeur qui sépare les 25% des données les plus hautes du reste. La médiane, elle, correspond au deuxième quartile (Q2). Ces indicateurs sont parfaits pour comprendre comment les données sont réparties, notamment dans la moitié basse et la moitié haute.
Exemple
Avec les notes ordonnées de Léa : 8, 11, 12, 14, 15. La médiane (Q2) est 12. - Pour Q1 : on prend la moitié inférieure (8, 11, 12). La médiane de cette sous-série est 11. Donc Q1 = 11. 25% des notes sont ≤ 11. - Pour Q3 : on prend la moitié supérieure (12, 14, 15). La médiane de cette sous-série est 14. Donc Q3 = 14. 75% des notes sont ≤ 14 (ou 25% sont ≥ 14).
Formule
Méthode de calcul (après avoir ordonné les données) : 1. Calculer la médiane (Q2) de la série complète. 2. Q1 = médiane de la sous-série des valeurs inférieures ou égales à Q2. 3. Q3 = médiane de la sous-série des valeurs supérieures ou égales à Q2.
Astuce
Imagine que tu ranges tes données sur une ligne. Q1, la médiane et Q3 sont comme des poteaux qui la découpent en quatre tronçons égaux. Q1 est à 1/4 du chemin, la médiane à 1/2, et Q3 à 3/4.
Interprétation et synthèse : lire l'histoire des données
Maintenant que tu sais calculer ces indicateurs, l'étape la plus importante est de les interpréter pour décrire la série. L'étendue te donne une idée de l'hétérogénéité. La médiane te renseigne sur le niveau général. Les quartiles, et surtout l'intervalle interquartile (Q3 - Q1), te montrent où se concentre la majorité des données. En comparant ces valeurs, tu peux dire si la distribution est équilibrée, si elle penche vers les valeurs basses ou hautes.
Exemple
Analyse des notes de la classe A (médiane=13, étendue=4, Q1=12, Q3=14) et de la classe B (médiane=13, étendue=12, Q1=9, Q3=16). Les deux classes ont la même médiane, donc un niveau central similaire. Mais la classe A a une étendue faible et des quartiles resserrés : les notes sont homogènes et groupées autour de 13. La classe B a une grande étendue et des quartiles éloignés : les notes sont très dispersées, avec de très bons et de très faibles élèves.
Formule
Intervalle Interquartile = Q3 - Q1 (Cet intervalle contient 50% des données, celles du 'cœur' de la série).
Astuce
Pour décrire une série, utilise la phrase magique : 'La moitié des valeurs sont autour de [médiane], avec une dispersion [faible/forte] car l'étendue est de [valeur].'
Notions clés à retenir
Médiane
Valeur qui partage une série ordonnée en deux groupes de même effectif. 50% des valeurs lui sont inférieures ou égales, 50% lui sont supérieures ou égales.
Étendue
Différence entre la valeur maximale et la valeur minimale d'une série. Elle mesure l'amplitude globale de la dispersion.
Premier Quartile (Q1)
Valeur qui sépare les 25% des données les plus basses des 75% restantes. 25% des valeurs lui sont inférieures ou égales.
Troisième Quartile (Q3)
Valeur qui sépare les 75% des données les plus basses des 25% les plus hautes. 75% des valeurs lui sont inférieures ou égales.
Série ordonnée
Série de données classée par ordre croissant (du plus petit au plus grand). C'est l'étape indispensable avant tout calcul de médiane ou de quartile.
Erreurs à éviter
- ✗Oublier de ranger la série dans l'ordre croissant avant de chercher la médiane ou les quartiles. C'est l'erreur numéro 1 !
- ✗Confondre la position (le rang) et la valeur. Quand N=7, la médiane est la valeur située au 4ème rang ( (7+1)/2 ), pas le nombre 4.
- ✗Pour une série avec un effectif pair, oublier de faire la moyenne des deux valeurs centrales pour la médiane. On ne choisit pas l'une des deux, on calcule leur moyenne.
- ✗Inclure la médiane dans les deux moitiés quand on cherche Q1 et Q3. Si la médiane fait partie des données, elle appartient aux deux sous-séries (inférieures ou égales, et supérieures ou égales).
Types d'exercices
Calcul simple
On te donne une petite série de nombres. Tu dois la ranger, puis calculer la médiane, l'étendue, Q1 et Q3.
À partir d'un tableau
Les données sont présentées dans un tableau d'effectifs (avec des valeurs et leur fréquence). Tu dois d'abord reconstituer la liste complète des valeurs ou utiliser les effectifs cumulés pour trouver les indicateurs.
Interprétation et comparaison
On te donne les indicateurs (médiane, étendue, quartiles) de deux séries différentes (ex : résultats de deux classes). Tu dois les comparer et décrire les différences en termes de niveau et de dispersion.
Problème concret
Mise en situation : analyser les températures d'une semaine, les salaires dans une entreprise, les temps au 100m... Tu devras extraire les données, calculer les indicateurs et répondre à des questions d'interprétation.
Pour aller plus loin
- La moyenne : un autre indicateur de tendance centrale, sensible aux valeurs extrêmes.
- Le diagramme en boîte (boîte à moustaches) : une représentation graphique qui utilise la médiane, les quartiles et les valeurs extrêmes.
- L'écart-type (au lycée) : une mesure de dispersion plus précise que l'étendue, qui tient compte de l'écart de chaque valeur à la moyenne.
