Guide du datajournalisme 1.0 BETA

Le fossé des opportunités

The Opportunity Gap project
The Opportunity Gap (_ProPublica_)

Le projet The Opportunity Gap exploite des données jusqu’alors jamais diffusées sur les droits civiques provenant du Department of Education américain et démontre que certains États, comme la Floride, offrent un accès à l’éducation supérieure pratiquement égal aux étudiants de toutes conditions sociales, alors que d’autres comme le Kansas, le Maryland et l’Oklahoma offrent moins d’opportunités dans les circonscriptions les plus pauvres.

Les données incluaient toutes les écoles publiques situées dans des circonscriptions de plus de 3 000 étudiants. Plus des trois quarts de tous les enfants scolarisés dans le public étaient représentés. Un reporter de notre rédaction a obtenu les données et le directeur du journalisme assisté par ordinateur (JAO) s’est chargé de les nettoyer en profondeur.

Le projet a duré environ trois mois. Au total, six personnes ont travaillé sur l’histoire et l’application : deux rédacteurs, un reporter, un responsable du JAO et deux développeurs. La plupart d’entre nous ne travaillions pas à plein temps sur ce projet.

Le projet demandait vraiment l’apport combiné de nos savoir-faire : une expertise dans le domaine de l’éducation, une compréhension des bonnes pratiques en matière de données, des compétences en matière de design et de programmation, etc. Mais surtout, nous devions être capables de trouver l’histoire dans les données. Nous avions également du texte à rédiger, non seulement pour l’histoire, mais aussi pour l’application elle-même.

Pour le nettoyage et l’analyse des données, nous avons principalement utilisé Excel avec des scripts de nettoyage, ainsi que MS Access. L’application a été écrite en Ruby on Rails et utilise pas mal de JavaScript.

Outre un article d’ensemble, notre couverture incluait une application interactive permettant aux lecteurs de trouver des exemples qui les touchaient personnellement dans cette grande base de données nationale. En utilisant notre application, un lecteur pouvait trouver l’école de son quartier, par exemple Central High School à Newark, dans le New Jersey, et consulter ses performances dans différents domaines. Il pouvait ensuite cliquer sur un bouton indiquant « Comparer à des écoles au taux de pauvreté faible/élevé » et afficher d’autres lycées, leur taux de pauvreté relatif, et les spécialités (« Advanced Placement courses ») qu’ils proposent. Dans notre exemple, le lycée Central High est comparé à Millburn Sr. High. On constate alors que si seulement 1 % des élèves de Millburn a droit à un déjeuner gratuit ou à prix réduit, 72 % d’entre eux suivent au moins un cours de spécialisation. À l’inverse, 85 % des élèves du lycée International High bénéficient d’un déjeuner gratuit/à prix réduit et seulement 1 % suit des cours de spécialisation.

À travers cet exemple, le lecteur peut se servir de quelque chose qu’il connaît – un lycée de son quartier – pour comprendre quelque chose qu’il ne connait pas : la distribution de l’accès à l’éducation, et dans quelle mesure la pauvreté en est un facteur déterminant. Nous avons également intégré l’application à Facebook pour qu’elle propose automatiquement aux lecteurs les écoles qui pourraient les intéresser.

Le trafic vers toutes nos applications est excellent, et nous sommes particulièrement fiers de la façon dont celle-ci permet de raconter une histoire complexe ; mais surtout, elle aide les lecteurs à se raconter leur propre histoire.

Comme pour la plupart des projets qui utilisent des données gouvernementales, celles-ci ont dû être nettoyées en profondeur. Par exemple, alors qu’il n’existe qu’une trentaine de cours de spécialisation possibles, certaines écoles disaient en proposer des centaines. Nous avons dû vérifier beaucoup d’informations à la main et appeler de nombreuses écoles pour obtenir confirmation ou correction.

Nous nous sommes également efforcés de faire en sorte que l’application raconte une histoire « lointaine » et une histoire « proche ». L’application devait brosser un portrait général et abstrait du pays et offrir un moyen de comparer chaque État en termes d’accès à l’éducation. Mais comme il est difficile pour les lecteurs de s’identifier à ces données abstraites, nous voulions également qu’ils puissent trouver l’école de leur quartier et la comparer à d’autres écoles du coin selon des critères de pauvreté.

Si je devais donner un conseil aux datajournalistes en herbe voulant s’attaquer à un projet de ce genre, je dirais que vous devez connaître le sujet et être entreprenant ! Toutes les règles qui s’appliquent à d’autres formes de journalisme s’appliquent aussi ici. Vous devez donner des faits exacts, vous assurer de bien raconter l’histoire, et surtout faire en sorte que votre application n’aille pas à l’encontre de la thèse de votre article. Si c’est le cas, il se peut que l’une des deux soit fausse.

Par ailleurs, si vous voulez apprendre à programmer, le plus important, c’est de commencer. Vous préférerez peut-être prendre des cours ou apprendre avec des livres ou des vidéos, mais assurez-vous d’avoir une vraie bonne idée de projet et de vous fixer une deadline. Si vous avez une histoire qui ne peut que prendre la forme d’une application, alors le fait que vous ne sachiez pas programmer ne doit pas vous arrêter !

Scott Klein, ProPublica