Histoires de données
On peut parfois avoir l’impression que le datajournalisme consiste juste à bien présenter des données – avec des visualisations qui traduisent une analyse ou un aspect des chiffres de façon percutante, ou des bases de données interactives permettant à chacun de chercher un endroit familier, comme sa rue ou l’hôpital de son quartier. Tout ceci peut être très utile, mais comme d’autres formes de journalisme, le datajournalisme doit aussi servir à raconter une histoire. Alors, quels sont les angles que vous pouvez trouver dans des données ? D’après mon expérience à la BBC, j’ai établi une liste, ou « typologie » des différents types d’angles que l’on peut rencontrer.
Je pense qu’il est utile de garder cette classification à l’esprit, non seulement quand vous analysez des données, mais également à l’étape d’avant, quand vous les recueillez (que ce soit en cherchant des bases de données accessibles au public ou en compilant des demandes d’accès à l’information).
1 . Mesure : l’angle le plus simple, compter ou additionner quelque chose : « les municipalités ont dépensé un total de x milliards d’euros en trombones l’an dernier ». Mais il est souvent difficile de savoir si c’est un chiffre élevé ou non. Pour cela, vous avez besoin du contexte, qui peut être fourni par :
-
proportion : « L’année dernière, les municipalités ont dépensé les deux tiers de leur budget papeterie en trombones. » ;
-
comparaison interne : « Les municipalités dépensent plus pour l’achat de trombones que pour distribuer des repas aux personnes âgées. » ;
-
comparaison externe : « L’année dernière, les municipalités ont dépensé le double du budget national d’aide humanitaire pour acheter des trombones. » ;
Il existe également d’autres façons d’explorer les données de manière contextuelle ou comparative.
2 . Évolution au fil du temps : « Les achats de trombones ont été multipliés par trois ces quatre dernières années. »
3 . Tableaux comparatifs : on compare souvent différentes zones géographiques ou institutions, et vous devez vous assurer que la comparaison est valable (en prenant par exemple en compte la taille de la population locale). « La municipalité de Groville achète plus de trombones par personne que n’importe quelle autorité locale, à un taux quatre fois supérieur à la moyenne nationale. » Vous pouvez également diviser les sujets en plusieurs groupes.
4 . Analyse par catégorie : « Les municipalités tenues par le parti Violet dépensent 50 % de plus en trombones que celles qui sont gérées par le parti Jaune. »
Vous pouvez enfin établir des relations numériques entre certains facteurs.
5 . Association : « Les municipalités gérées par des politiciens financés par l’industrie papetière achètent plus de trombones, les dépenses augmentant en moyenne de 100 euros pour chaque euro reçu. »
Mais souvenez-vous bien sûr que corrélation et causalité sont deux choses bien différentes.
Ainsi, si vous enquêtez sur les achats de trombones, avez-vous également obtenu les données suivantes ?
-
Dépenses totales pour définir le contexte ?
-
Répartition géographique/historique/autre pour fournir des données comparatives ?
-
Les données supplémentaires dont vous avez besoin pour vous assurer que les comparaisons sont valables, comme la taille de la population ?
-
D’autres données à comparer ou recouper qui pourraient offrir une analyse intéressante ?
Martin Rosenbaum, BBC