Peut-on croiser n’importe quelles données ? Le National Geographic a produit une cartographie1 – magnifique au demeurant – qui pose des questions de visualisation évidentes : sur une carte du monde sont superposées des données liées à la densité de population et au revenu moyen par habitant. La vue d’ensemble est très efficace : classés selon les quatre catégories de la Banque mondiale (low, lower middle, upper middle et high), les pays forment une mosaïque qui illustre les disparités en matière de richesse.

Le diable se cache dans les détails

C’est bien une question de niveau de détail qui pose problème dans cette carte : deux sources de données sont superposées, quand bien même elles ne décrivent pas une même spatialité.

National Geographic Asia1. Les données financières : Les Etats sont colorés en fonction de leur moyenne nationale de revenu annuel par habitant. Cette moyenne homogénéise les Etats. Ce n’est pas forcément un mal en soi en terme de visualisation puisque, pour s’offrir une vue globale lisible, il faut parfois savoir simplifier le niveau de précision. D’ailleurs, les moyennes nationales sont des valeurs officialisées et normalisées, souvent prises comme références2.

National Geographic America

2. Les données démographiques : L’échelle est nettement plus fine que dans le cas des données financières puisque la densité de population est affichée selon les localités (manifestement), dans un style graphique “lumières de la Terre vue de l’espace”. C’est une visualisation qui rend très bien compte du fait que la population n’est pas répartie de manière homogène dans les territoires (à l’image de l’Australie, de l’Algérie ou de la Russie, par exemple).

Conséquence, une carte qui pense montrer le détail mais qui ne le montre pas

National Geographic AsiaEst-ce que toute la population de Chine fait partie de la catégorie “Lower middle” ? Non, certainement pas. Si l’on comprend bien que les données financières concernent tout l’Etat, pas de problème, mais l’impression visuelle est faussée parce que l’unité de cette carte n’est plus l’Etat mais la localité. Il est donc juste de dire que le revenu annuel moyen chinois se classe dans cette catégorie, mais il est par contre faux de l’assigner comme tel à toutes les localités chinoises, susceptibles d’être les théâtres de nombreuses variations locales !

National Geographic Europe

Bien joli de représenter la France d’un bleu lumineux alors qu’il est évident que le revenu moyen y est très variable en fonction des régions ! Si c’est le revenu moyen du pays qui nous intéresse, alors pourquoi ne pas colorer la France d’un bleu homogène ? Donnant une apparence de complexité, la surimpression des données démographiques aux données financières des Etats trompe l’oeil du lecteur non averti. Par inadvertance évidemment, mais cette étude de cas doit nous servir à mener une discussion sur nos pratiques de visualisation.

Comment perdre le sens des données…

NationalGeographicFiguresLa carte est assortie de trois pages de tableaux comparatifs qui seraient d’un intérêt certain s’ils ne se basaient pas sur un autre référentiel. Une note indique en effet que les populations sont triées à l’intérieur des pays selon les quatre catégories de richesse avant d’être compilées. Cela signifie donc que toute la population chinoise n’est pas présente dans le cercle rouge (qui correspond pourtant à la couleur de la Chine sur la carte) mais que les habitants plus fortunés sont désormais comptés dans les cercles supérieurs. C’est une excellente chose qui évite qu’on ne fasse la statistique de l’espérance de vie des populations dont l’Etat est globalement jugé comme “Lower middle” (par exemple) sans tenir compte de l’hétérogénéité de ces populations. Mais cela signifie aussi que ces tableaux se basent sur des données qui ne sont pas exprimées dans la carte3 !

National Geographic AfricaBref, quand bien même ces tableaux expriment des données correctement pondérées, la réutilisation du code couleur de la carte rend très peu probable que le lecteur comprenne qu’on ne parle plus de la même chose : comme il ne s’agit pas des moyennes d’Etats compilées4, les couleurs ont ici une nouvelle signification (on ne parle plus des Etats mais de la globalité).

Lien vers la carte du National Geographic

  1. Elle date manifestement de 2011, avec des données de 2009. Désolé du manque de fraîcheur de ce billet, mais je ne l’ai découverte qu’aujourd’hui.
  2. On peut remettre en question la quadripartition de la Banque mondiale, mais ce n’est pas l’objet de ce billet.
  3. D’ailleurs, si ces données précises à l’intérieur des Etats existent, pourquoi ne pas les intégrer sur la carte ? Est-ce parce qu’elles sont disparates ? Ou parce qu’elles sont issues de statistiques non localisées ?
  4. Encore heureux, parce que cela nous donnerait une sorte de “moyenne de moyennes” qui interdirait toute analyse.