Guide du datajournalisme 1.0 BETA

Datajournalisme à la BBC

Le terme « datajournalisme » peut recouvrir de nombreuses disciplines et son sens peut varier selon les organisations, alors il peut être utile de définir ce que nous entendons par « datajournalisme » à la BBC. Globalement, ce terme englobe les projets qui utilisent des données pour :

  • permettre au lecteur de trouver des informations qui le concernent personnellement ;
  • révéler une histoire remarquable jusqu’alors passée inaperçue ;
  • aider le lecteur à mieux comprendre un problème complexe.

Ces catégories peuvent se chevaucher, et dans un environnement numérique, s’accompagnent souvent de visualisations.

Donner une dimension personnelle

Sur le site web BBC News, nous utilisons des données pour offrir des services et des outils à nos utilisateurs depuis plus de dix ans.

L’exemple le plus constant, que nous avons publié pour la première fois en 1999, est notre classement des établissements scolaires, qui exploite les données publiées chaque année par le gouvernement. Les lecteurs peuvent chercher des écoles par code postal et les comparer selon un certain nombre de critères. Des journalistes spécialistes de l’éducation travaillent également avec l’équipe de développement pour dénicher des histoires intéressantes avant que les données ne soient publiées.

Quand nous nous sommes attaqués à ce projet, il n’existait pas de site officiel permettant au public d’explorer les données. Mais maintenant que le Department for Education offre un service comparable, nous nous intéressons plutôt aux histoires qui émergent de ces données.

Le défi dans ce domaine consiste à offrir un accès aux données qui présentent un réel intérêt pour le public. Par exemple, nous avons récemment réalisé un projet intitulé « Every death on every road » (« Chaque mort sur chaque route ») dans lequel nous dévoilions une vaste base de données normalement inaccessible au public. En offrant une fonction de recherche par code postal, nous permettions aux utilisateurs de déterminer l’emplacement de tous les accidents de la route mortels survenus au cours de la décennie écoulée au Royaume-Uni.

Nous avons créé des visualisations pour certains des faits et des chiffres marquants qui ressortaient des données de la police, et pour donner au projet un aspect plus dynamique et humain, nous avons fait équipe avec la London Ambulance Association ainsi que la radio et chaîne de TV BBC London afin de suivre les accidents en direct dans la capitale. Ils étaient signalés en direct sur le site ainsi que sur Twitter avec le hashtag #crash24, et les collisions étaient cartographiées en temps réel.

Des outils simples

Tout en offrant la possibilité d’explorer de grosses bases de données, nous avons rencontré un certain succès en créant des outils simples permettant aux utilisateurs de trouver des informations qui les concernent personnellement. Ces outils plaisent aux gens qui n’ont pas forcément le temps de lire une analyse détaillée. La possibilité de partager un fait qui concerne la vie personnelle des gens est quelque chose que nous avons commencé à intégrer comme étant normal.

Un exemple un peu trivial de cette approche est notre article « The world at 7 billion : What’s your number ? » (« Sept milliards dans le monde : quel est votre numéro ? »), publié pour coïncider avec la date officielle à laquelle la population mondiale devait dépasser les sept milliards d’individus. En entrant sa date de naissance, l’utilisateur obtenait son « numéro » et pouvait le partager via Twitter ou Facebook. L’application utilisait des données fournies par le Fonds des Nations unies pour la population. Elle a remporté un vif succès, au point de devenir le lien le plus partagé sur Facebook en 2011 au Royaume-Uni.

The World at Seven Billion
7 milliards d'humains (BBC)

Comme autre exemple récent, on peut citer le calculateur de budget de la BBC, qui permettait aux utilisateurs de calculer combien d’argent ils perdraient ou gagneraient lors de l’entrée en vigueur du budget annuel – puis de partager ce chiffre. Nous nous sommes associés au cabinet d’expertise comptable KPMG LLP, qui nous a fourni des calculs basés sur le budget annuel, puis nous avons travaillé d’arrache-pied pour concevoir une interface attrayante qui encouragerait les utilisateurs à utiliser le calculateur.

Analyser les données

Mais où est le journalisme là-dedans ? Trouver les histoires qui se cachent dans les données est une définition plus traditionnelle du datajournalisme. Y a-t-il un scoop enterré dans la base de données ? Tous les chiffres sont-ils corrects ? Est-ce qu’ils prouvent ou réfutent une théorie ? Ce sont autant de questions qu’un datajournaliste doit se poser. Mais on peut perdre beaucoup de temps à tamiser une énorme base de données en espérant trouver quelque chose de remarquable.

Dans ce domaine, nous avons constaté qu’il était plus productif de s’associer avec des équipes ou des programmes d’investigation ayant l’expertise et le temps nécessaires pour enquêter. Le programme d’affaires publiques Panorama de la BBC a passé des mois à travailler avec le Centre for Investigative Journalism afin de recueillir des données sur les salaires du secteur public. Cette collaboration a produit un documentaire TV et un rapport spécial en ligne, « Public sector pay : the numbers » (« Salaires du secteur public : les chiffres »), dans lequel toutes les données étaient publiées et visualisées avec une analyse secteur par secteur.

En plus de savoir s’associer à des journalistes d’investigation, il est essentiel d’être en contact avec des journalistes spécialisés. Quand un collègue spécialiste en économie a analysé des données sur les coupes budgétaires prévues par le gouvernement, il en a conclu que celui-ci exagérait la portée de ces mesures. Cela a donné un dossier exclusif, « Making sense of the data » (« Comprendre les données »), accompagné d’une visualisation claire, qui a remporté un prix de la Royal Statistical Society.

Comprendre un problème

Mais le datajournalisme ne consiste pas nécessairement à repérer des exclusivités. Le rôle de l’équipe de visualisation de données est de combiner un bon design avec une narration éditoriale claire pour offrir une expérience prenante à l’utilisateur. Une visualisation attrayante utilisant les bonnes données peut permettre de mieux comprendre un problème ou une histoire, et nous utilisons souvent cette approche dans notre storytelling à la BBC. Une technique utilisée dans notre décompte des demandeurs d’emploi au Royaume-Uni consiste à présenter l’évolution chronologique des données sur une carte pour donner une vision claire des changements.

La visualisation « Eurozone debt web » (« Toile de la dette de l’Eurozone ») explore le complexe enchevêtrement des prêts entre pays. Elle explique un problème compliqué de manière visuelle, à l’aide de couleurs et de flèches proportionnelles et d’un texte clair. Il est important d’encourager l’utilisateur à explorer les fonctions ou à suivre une trame narrative sans qu’il ne se sente submergé par les chiffres.

Vue d’ensemble de l’équipe

L’équipe chargée du datajournalisme pour le site web BBC News compte environ 20 journalistes, designers et développeurs.

Outre des projets et des visualisations de données, l’équipe produit toutes les infographies et les fonctions multimédia interactives du site web. Tout cela forme un ensemble de techniques de storytelling que nous appelons « journalisme visuel ». Personne n’est expressément identifié comme datajournaliste, mais tout le staff éditorial de l’équipe doit être capable d’utiliser des applications de calcul basiques comme Excel et Google Docs pour analyser des données.

Les compétences de nos développeurs et de nos designers sont cruciales pour tous nos projets de données. Bien que nous soyons tous des journalistes, des designers ou des développeurs « avant tout », nous nous efforçons d’améliorer nos compétences dans les domaines d’expertise des autres.

Les principaux produits que nous utilisons pour explorer des données sont Excel, Google Docs et Fusion Tables. L’équipe travaille également, dans une moindre mesure, avec des bases de données MySQL et Access ainsi que Solr pour explorer de plus grosses bases de données, et utilise RDF et SPARQL pour déterminer de nouvelles manières de modéliser des évènements à l’aide des technologies du Web de données (« Linked Data »). Les développeurs utilisent également leur langage de programmation de prédilection, que ce soit ActionScript, Python ou Perl, pour comparer, analyser ou déconstruire les bases de données sur lesquelles nous travaillons. Perl est également utilisé pour une partie de la publication.

Nous nous servons de Google, Bing Maps et Google Earth, ainsi que du logiciel ArcMap d’Esri pour explorer et visualiser les données géographiques.

Pour les graphiques, nous employons la suite Adobe, notamment After Effects, Illustrator, Photoshop et Flash, quoique rarement pour ce dernier car JavaScript – tout particulièrement jQuery et d’autres librairies comme Highcharts, Raphael et D3 – répond de plus en plus à nos besoins en matière de visualisation.

Bella Hurrell et Andrew Leimdorfer, BBC