Comment recréer un graphe à barres empilées non trompeur ?

Un ami m’a partagé une capture d’écran d’une charte graphique passée visiblement à télévision française : le graphe communiquait le niveau de confiance des français vis-à-vis des vaccins contre le COVID disponibles sur le marché :

Malgré un titre relativement clair qui permet de comprendre ce que la visualisation doit représenter, ce graphe de barres empilées comporte plusieurs problèmes :

La source des données présentées n’est pas spécifiée : est-ce un sondage de 100, 1000 ou 10000 personnes ?
La surabondance des couleurs au sein de la charte ajoute beaucoup de bruit et ne facilite pas la lecture : qu’est-ce que l’audience doit retenir ?
Le système de comparaison qui change au sein même du graphe (et c’est sans doute là le problème le plus grave): on peut voir le % de oui pour 3 vaccins mais le 1er est en fait le % de personnes ayant répondu non.

La façon dont ce graphe a été construite relève de tout, sauf d’une neutralité se basant sur les faits. En utilisant ce système de barres empilées, BFMTV souhaite partager avec son audience le fait que le vaccin Astrazeneca est celui pour lequel la population française se méfie le plus.

En prenant un peu de recul, n’importe qui mérite déjà d’avoir des données présentées de la même façon, sans faire le focus sur un item alors que la vérité cachée est différente. Le COVID est bien sûr un sujet sensible et on a l’impression qu’Elabe nous donne un avis biaisé à travers cette visualisation de barres empilées (stack bar chart en anglais).

A partir des données affichées (et en faisant des recherches sur la source), je me suis amusé à refaire le graphe.

J’ai conservé le format charte de barres empilées car 1) il est adapté au cas présent et 2) je ne souhaite pas que les gens pensent que c’est le format de la charte qui est en cause.

A partir de là, j’ai procédé comme suit :

La question reste le titre de la charte graphique.
J’ajoute une légende pour faciliter la lecture globale du graphe.
Je choisi un code couleur adapté qui aide mon audience à se focaliser sur ce que je souhaite communiquer.
J’ajoute également les informations relatives à la source et l’échantillonage.
Je choisis de réaliser 2 chartes quasi identiques : seule l’approche change (vous êtes du genre la bouteille à moitié vide ou pleine 🙂 ?)

Cette nouvelle charte affiche les données en conservant une logique d’affichage et en se focalisant sur le oui.

Même charte graphique, sauf que j’ai choisi de focaliser mon attention sur le non.

Les données sont les mêmes que sur la charte d’origine de barres empilées. La seule différence est que je me focalise sur les faits, sans tenter de biaiser la compréhension de l’audience.

Il est intéressant de voir qu’au final, le vaccin qui suscite le plus d’inquiétude (sur un échantillon de 1000 personnes seulement) est le Janssen et non l’Astrazeneca. En revanche, il semble que plus de la moitié de cet échantillon (soit à peine plus de 500 personnes) porte une confiance suffisante au Pfizer.

Arnaud Mangasaryan

Arnaud Mangasaryan est SEO manager chez Workleap et auteur / partageur d’expérience sur Histoire de Data.