Guide du datajournalisme 1.0 BETA

La visualisation, meilleur outil du datajournaliste

Avant d’essayer de créer un graphique ou une carte à partir de vos données, prenez une minute pour réfléchir aux nombreux rôles que les éléments graphiques statiques et interactifs peuvent jouer dans votre pratique du journalisme.

Au cours de la phase d’investigation, les visualisations peuvent :

  • vous aider à identifier des thèmes et des questions pour la suite de votre travail journalistique ;
  • identifier les aberrations, les angles intéressants ou les erreurs que contiennent vos données;
  • vous aider à trouver des exemples typiques ;
  • révéler les failles de votre travail journalistique.

Les visualisations peuvent également jouer de nombreux rôles dans la publication. Elles peuvent :

  • illustrer un élément de l’article de manière plus convaincante ;
  • permettre de supprimer les informations trop techniques du texte de l’article ;
  • rendre votre processus journalistique plus transparent, particulièrement avec les visualisations interactives.

Il paraît alors judicieux de commencer à développer des visualisations tôt dans votre travail d’investigation et régulièrement. Ne voyez pas cela comme une étape séparée, quelque chose à considérer une fois que l’article est en grande partie écrit. Laissez ce travail guider votre enquête.

Pour commencer, il suffit parfois de présenter les notes que vous avez déjà prises sous une forme visuelle. Prenez le graphique de la figure ci-dessous, qui est paru dans Washington Post en 2006.

Subventions agricoles dans le temps
Subventions agricoles dans le temps (Washington Post)

Il illustre la part des revenus agricoles associée aux subventions et aux évènements importants de ces 45 dernières années, et a été développé sur plusieurs mois. Il a été difficile de trouver des données comparables entre elles sur toute cette période. L’étude systématique de tous les pics et les creux nous a permis de retrouver le contexte historique, ce qui nous a aidé pour tout le reste de l’investigation. Cela signifie également que nous avions pratiquement fini cette corvée avant que les articles ne soient écrits.

Voici quelques astuces pour utiliser des visualisations afin de commencer à explorer vos bases de données.

Astuce 1 : utiliser des graphiques multiples pour vous orienter rapidement dans une grosse base de données

J’ai utilisé cette technique au Washington Post pour vérifier une information qui nous était parvenue, prétendant que l’administration de George W. Bush offrait des bourses sur des motifs politiques et sans véritable fondement. La plupart de ces programmes d’aide sont calculés par des formules, et certains sont financés depuis des années, alors nous étions curieux de voir si nous pouvions déterminer des tendances en examinant près de 1 500 flux différents.

Les sparklines peuvent aider à trouver des angles
Les sparklines peuvent aider à trouver des angles (Washington Post)

J’ai créé un graphique pour chaque programme, les points rouges indiquant les années d’élections présidentielles, et les points verts les législatives. Problème : oui, il y a bien un pic dans les six mois précédant l’élection présidentielle pour plusieurs de ces programmes – les points rouges avec le montant maximal noté à côté – mais il s’agit de la mauvaise élection. Les tendances apparaissent au cours de l’élection présidentielle de 2000 opposant Al Gore à George W. Bush, pas en 2004.

Ce phénomène est beaucoup plus visible sur une série de graphiques que dans un tableau plein de chiffres, et le format interactif permet d’examiner divers types de subventions, de régions et d’agences. Plusieurs cartes statiques présentées côte à côte sont parfois plus facile à comparer qu’une carte interactive.

Cet exemple a été créé avec un petit programme écrit en PHP, mais c’est maintenant beaucoup plus simple avec les sparklines d’Excel 2007 et 2010. Edward Tufte, l’expert en visualisation, a inventé ces graphiques « intenses et simples comme des mots » pour communiquer des informations sur une vaste base de données en un coup d’œil. Aujourd’hui, on les retrouve partout, des cours de la bourse aux résultats sportifs.

Astuce 2 : regarder ses données dans tous les sens

Quand vous essayez de comprendre une histoire ou une base de données, il n’y a pas de mauvaise façon de la regarder ; essayez toutes les méthodes qui vous viennent à l’esprit pour avoir plusieurs points de vue. Si vous enquêtez sur la criminalité d’une ville, vous voudrez peut-être créer un jeu de graphiques présentant l’évolution des crimes violents au cours de l’année, un autre pour le changement en pourcentage, un autre pour la comparer à d’autres villes, et un autre pour illustrer l’évolution à plus long terme. Utilisez des chiffres bruts, des pourcentages et des indicateurs.

Regardez-les sous différentes échelles. Faites varier l’origine de l’abscisse. Essayez les logarithmes et les racines carrées avec les données qui présentent une distribution inhabituelle.

Les expériences de William Cleveland sur la perception visuelle démontrent que l’œil perçoit mieux les variations d’une courbe quand la pente moyenne est de 45 degrés. N’hésitez donc pas à faire varier les proportions pour obtenir le graphique le plus parlant. Une étude suggère par ailleurs qu’il faut déterminer un niveau cible comme limite de votre graphique. Chacune de ces méthodes vous permettra de voir les données sous des angles différents. Quand elles cesseront de vous apporter de nouvelles informations, vous saurez que vous en avez fini.

Astuce 3 : ne rien prendre pour acquis

Maintenant que vous avez étudié vos données sous tous les angles, vous avez probablement trouvé des entrées qui paraissent incorrectes – vous ne comprenez peut-être pas ce qu’elles signifient, ou vous avez repéré des aberrations qui semblent dues à des coquilles, ou des tendances inverses à ce que vous attendez. Si vous voulez publier quoi que ce soit se basant sur votre exploration préliminaire, vous devez résoudre ces questions et vous ne pouvez pas vous contenter de suppositions. Il s’agit soit d’angles intéressants, soit de malentendus.

Il n’est pas inhabituel pour les gouvernements locaux de produire des feuilles de calcul remplies d’erreurs, et il est également facile de mal comprendre le jargon gouvernemental dans une base de données. Commencez par remonter le fil de votre propre travail. Avez-vous lu la documentation et le problème provient-il de la version originale des données ? Si tout semble bon de votre côté, c’est le moment de décrocher le téléphone. Vous allez devoir résoudre le problème si vous comptez utiliser les données, alors autant commencer tout de suite.

Cela dit, toutes les erreurs ne sont pas importantes. Dans les livres de compte des campagnes politiques, qui contiennent plus de 100 000 entrées, il est courant d’avoir plusieurs centaines de codes postaux qui n’existent pas. Du moment qu’elles ne concernent pas toutes la même ville ou le même candidat, quelques erreurs occasionnelles ne devraient pas poser de problème.

La question que vous devez vous poser est : si je devais utiliser ces données, les lecteurs auraient-ils une vision fondamentalement précise de ce qu’elles veulent dire ?

Astuce 4 : ne pas être obsédé par la précision

Ne vous préoccupez pas trop de la précision avant que cela n’importe vraiment. Vos graphiques préliminaires doivent être globalement corrects, mais ne vous inquiétez pas si vous avez différents niveaux d’arrondi, si les totaux ne font pas exactement 100 % ou s’il vous manque des données pour une ou deux années sur vingt. Cela fait partie du processus d’exploration. Vous pourrez tout de même déterminer les tendances générales et vous saurez quelles données vous devez recueillir avant la publication.

Vous pouvez même essayer de supprimer les légendes et les indicateurs d’échelle, un peu comme sur les graphiques des figures précédentes, pour vous faire une idée plus globale des données.

Astuce 5 : créer une chronologie des évènements

Quand vous vous attaquez à une histoire complexe, commencez par créer la chronologie des évènements importants. Vous pouvez utiliser Excel, un document Word ou un outil spécial comme TimeFlow pour réaliser cette tâche, mais à un certain stade, vous trouverez une base de données que vous pourrez utiliser comme un calque. En superposant les deux régulièrement, vous pourrez colmater les brèches dans votre enquête.

Astuce 6 : collaborer étroitement avec le service graphique

Réfléchissez aux graphiques possibles avec les graphistes et les designers de votre rédaction. Ils auront de bonnes idées pour visualiser vos données, des suggestions pour les rendre interactives et les relier à l’histoire. Votre travail sera beaucoup plus simple si vous savez quelles données vous devez recueillir dès le départ, ou si vous pouvez prévenir votre équipe qu’un graphique sera impossible à réaliser parce que certaines données sont inaccessibles.

Conseils pour la publication

Vous n’avez peut-être passé que quelques jours ou quelques heures à explorer les données, ou à l’inverse vous avez mis des mois à écrire votre article. Mais quand l’heure de la publication approche, deux aspects prennent plus d’importance.

Vous vous souvenez de cette année qui vous manquait au début de votre exploration ? Tout d’un coup, vous ne pouvez plus vous en passer. Toutes ces mauvaises données que vous avez ignorées au cours de votre enquête ? Elles vont revenir vous hanter. Car il est impossible d’écrire à partir de mauvaises données. Pour un graphique, soit vous avez toutes les données nécessaires, soit vous ne les avez pas.

Soignez la collecte de données pour les graphiques interactifs

Il est impossible de tricher avec un graphique interactif. Si vous voulez vraiment que vos lecteurs explorent les données comme ils le souhaitent, alors chaque donnée doit être ce qu’elle dit être. Les utilisateurs peuvent déceler une erreur à tout moment, et celle-ci pourra vous tracasser pendant des mois, voire des années. Si vous construisez votre propre base de données, vous devez donc vous attendre à relire, vérifier les faits et corriger l’intégralité de la base de données. Si vous utilisez des données gouvernementales, vous devez décider de la quantité de données que vous vérifierez, et de ce que vous comptez faire quand vous trouverez une erreur.

Concevez pour deux types de lecteurs

Le graphique – que ce soit une fonctionnalité interactive autonome ou une visualisation statique accompagnant votre article – doit répondre à deux différents types de lecteurs. Il doit être facile à comprendre d’un coup d’œil, mais suffisamment complexe pour offrir quelque chose d’intéressant aux gens qui veulent aller plus loin. Si vous créez un graphique interactif, assurez-vous que vos lecteurs en retirent quelque chose de plus qu’un simple nom ou numéro.

Communiquez une idée, puis simplifiez

Vous voulez vous assurer que les gens retiennent une information particulière ? Décidez de l’impression que vous voulez laisser aux lecteurs et faites disparaître tout le reste. Bien souvent, vous devrez supprimer des informations alors même qu’Internet vous permet de toutes les publier. À moins que votre objectif principal ne soit la transparence, la plupart des détails que vous aurez recueillis dans votre chronologie ne seront pas très importants. Sur un graphique statique, ce sera intimidant. Sur un graphique interactif, ce sera ennuyeux.

Sarah Cohen, Duke University