09/11/2023
Sur le modèle des fonctions NB.SI
, il existe des fonctions permettant de calculer des sommes conditionnelles, des moyennes conditionnelles, des minima ou maxima conditionnels : SOMME.SI
, SOMME.SI.ENS
, MOYENNE.SI
, MOYENNE.SI.ENS
, MIN.SI
, MIN.SI.ENS
, MAX.SI
, MAX.SI.ENS
.
Le premier but de cette page est de travailler certaines de ces fonctions. Nous recroiserons aussi des fonctions comme EQUIV
ou INDIRECT
. Les exercices nous amèneront également à réviser les références relatives et absolues (placement des $).
Les données utilisées pour cet exercice sont des données réelles récupérées au format CSV. La partie 1 présente ces données. La partie 2 contient les exercices avec les nouvelles fonctions. Les deux parties sont indépendantes.
Pour cet exercice, nous considérons un jeu de données ouvert mis à disposition par la SCNF. Les données ont été récupérées à l’adresse suivante le 25/11/2020 : https://www.data.gouv.fr/fr/datasets/repartition-par-age-de-l-effectif-sncf/.
Ces données concernent la répartition de l’effectif de la SNCF par âge au 31 décembre de 2010 à 2018 (pour en savoir plus consulter le lien précédent).
Récupérez les données du fichier repartition-age-effectif.csv et enregistrez une version au format ods (si vous utilisez Open ou Libre Office Calc) ou au format xlsx si vous utilisez Microsoft Excel.
Récupérez de nouveau les données du fichier repartition-age-effectif.csv en vous trompant volontairement de séparateur mais en utilisant un caractère non présent dans le fichier (par exemple la tabulation). Les données vont se placer dans une seule colonne. Utilisez ensuite l’outil « Convertir » (avec Microsoft Excel) ou « Texte en colonnes… » (avec Open Office ou Libre Office Calc).
Les données ouvertes ne sont pas toujours cohérentes.
Par exemple, en plaçant un filtre, observez que dans la colonne « college », le collège « Exécution sédentaire » est orthographié « Exécution sédentaire » et « Exécution sédentaires ».
Avec un recherche/remplacement, remplacez toutes les occurrences de « Exécution sédentaires » par « Exécution sédentaire ».
Observez que les catégories d’âge ne sont pas toujours respectées dans nos données d'étude. Il existe des catégories d’âge « De 45 à 49 ans » et « 50 ans et plus » qui ne sont utilisées que pour le collège « Exécution roulant conduite ». Difficile ici de reconstituer les classes « De 45 à 54 ans » et « 55 ans et plus » pour avoir un jeu de données plus cohérents.
Travaillez à partir des fichiers suivants repartition-age-effectif.ods et repartition-age-effectif.xlsx selon votre préférence. La feuille « données » contient les données récupérées (et nettoyées) précédemment. La feuille « analyse » contient un tableau de bord à remplir.
Remplissez les différentes parties du tableau de bord.
L’ensemble des formules doivent pouvoir continuer à fonctionner et donner les mêmes résultats quel que soit le tri réalisé par la suite sur les données. Ci-suivent pour chaque zone des indications et suggestions complémentaires. Les nouvelles fonctions ne sont pas expliquées : utilisez l’assistant fonction ou l’aide en ligne (et consultez votre enseignant).
Conseil : dans la feuille des données, un volet a été placé. Utilisez-le. Si vous ne savez plus comment on le place. Révisez.
Consigne générale pour le format des cellules : affichez les nombres en utilisant le séparateur des milliers et sans chiffre après la virgule
Explications et suggestions
C4:C12
) : utilisez la fonction
SOMME.SI
.
D4:D12
) : calculez le rang de l'année dans le classement par ordre croissant d'effectif ; utilisez la fonction RANG
.C14:C17
et C19
) : fonctions classiquesC20:C21
) :
NB.SI
.">="&C14
(la condition est obtenue en concaténant
l’opérateur >=
et la valeur de C14
qui est la moyenne des
effectifs de l’année (on pourrait aussi utiliser
">="&MOYENNE(C4:C12)
). Cette condition est à
adapter pour l’étude (vérification) de la médiane.EQUIV
pour déterminer le numéro de ligne à laquelle
l’effectif minimum (contenu en C16
) se trouve dans la plage
C4:C12
"B"
devant : vous aurez une formule de la
forme "B"&(EQUIV(...)+1)
qui vous donnera la
référence de la cellule qui contient l’année cherchée (pour rappel, l'opérateur &
est l'opérateur de concaténation ; on peut utiliser la fonction CONCATENER
à la place de cet opérateur).INDIRECT
pour retrouver l’annéeB4:D11
la ligne (année + effectif) correspondant à
l’effectif minimal et la ligne correspondant à l’effectif
maximalG3:G8
) :
utilisez la fonction MOYENNE.SI
.G12:G19
) : idem.I3:O10
) : utilisez
la fonction MOYENNE.SI.ENS
. Remarque : comme pour certaines tranches d'âge et certains collèges il n'y a pas de données, une division par 0 peut se produire. Dans un tel cas, n'affichez rien (le calcul ne doit rien afficher).I24
) par tranche d’âge et par collège
(J26:O33
) : utilisez la fonction SOMME.SI.ENS
J34:O34
, P26:P33
,
P34
) : utilisez la fonction SOMME
.Remarque
Questions complémentaires