Guide du datajournalisme 1.0 BETA

Aller chercher les talents dans les hackathons

Hackathons: intensifier la relation entre journalistes et développeurs
Journalistes et développeurs au RegioHack (photo de Heinze Havinga)

En mars 2010, l’organisation culturelle numérique SETUP, basée à Utrecht, a organisé un évènement intitulé Hacking Journalism pour promouvoir une plus grande collaboration entre développeurs et journalistes.

« Nous organisons des hackathons pour développer des applications cools, mais nous ne parvenons pas à reconnaître les histoires intéressantes dans les données. Ce que nous construisons n’a aucune pertinence sociale », disaient les programmeurs. « Nous reconnaissons l’importance du datajournalisme, mais nous n’avons pas les compétences techniques nécessaires pour concevoir ce que nous voulons », disaient les journalistes. Dans un journal régional comme le nôtre, il n’y avait ni l’argent ni la motivation pour engager un programmeur dans la salle de rédaction. Le datajournalisme était encore une variable inconnue pour les journaux hollandais à cette époque.

Le modèle du hackathon était idéal ; un environnement de travail informel avec plein de pizzas et de boissons énergétiques. RegioHack était un hackathon organisé par mon employeur, le journal régional De Stentor, notre publication sœur TC Tubantia ainsi que l’école Saxion Hogescholen Enschede, qui avait mis à disposition le local pour l’évènement. La configuration était la suivante : tout le monde pouvait s’inscrire à un hackathon de 30 heures. Nous offrions la boisson et la nourriture. Nous attendions 30 participants, répartis en six groupes. Les groupes devaient se pencher sur différents sujets, comme la criminalité, la santé, les transports, la sécurité, le vieillissement de la population et l’énergie. Pour nous, les trois principaux objectifs de cet évènement étaient les suivants.

Trouver des histoires

Pour nous, le datajournalisme est une chose totalement nouvelle et inconnue. Notre seule façon de démontrer son utilité, c’est à travers des histoires bien ficelées. Nous avions l’intention de produire au moins trois histoires basées sur des données.

Nouer des liens

Nous, les journalistes, ne savions pas comment faire du datajournalisme et nous ne prétendions pas le savoir. En mettant des journalistes, des étudiants et des programmeurs dans la même pièce pendant 30 heures, nous souhaitions qu’ils partagent leurs idées et leurs connaissances.

Héberger un évènement social

Les journaux n’organisent pas beaucoup d’évènements sociaux, encore moins de hackathons. Nous voulions comprendre comment ce genre d’évènement pouvait produire des résultats. En fait, l’atmosphère aurait pu être tendue : 30 heures avec des inconnus, beaucoup de jargon, de prises de tête sur des questions basiques, un vrai saut en dehors de notre zone de confiance. En organisant un évènement social (avec des pizzas et des boissons énergétiques, vous vous souvenez ?), nous voulions créer un environnement dans lequel les journalistes et les programmeurs puissent se sentir à l’aise et collaborer efficacement.

Avant l’évènement, TC Tubantia avait interviewé la veuve d’un policier qui avait écrit un livre retraçant la carrière de son mari. Elle possédait également un document détaillant tous les meurtres comptabilisés dans l’Est des Pays-Bas, tenu par son mari depuis 1945. En temps normal, nous aurions publié ce document sur notre site web, mais cette fois-ci, nous avons créé un tableau de bord à l’aide du logiciel Tableau. Nous avons également rédigé un billet sur notre blog RegioHack détaillant comment tout s’était mis en place. Au cours du hackathon, un groupe a eu l’idée d’un sujet portant sur le développement des écoles et le vieillissement de la population de notre région. En créant une visualisation des projections futures, nous avons compris que le déclin des inscriptions allait finir par poser problème dans certaines villes. À partir de cette information, nous avons écrit un article sur l’impact que cela aurait sur les écoles de notre région.

Nous avons également démarré un projet très ambitieux intitulé De Tweehonderd van Twente (« Les deux cents de Twente ») afin de déterminer qui détenait le plus de pouvoir dans notre région et de construire une base de données des personnes les plus influentes. À l’aide d’un algorithme employant Google – pour déterminer qui a le plus de liens avec des organisations de pouvoir – nous allons dresser une liste de personnes influentes. Cela donnera vraisemblablement lieu à une série d’articles, mais cela sera également un outil puissant pour les journalistes. Qui entretient des liens avec qui ? Vous pourrez poser des questions à cette base de données et l’utiliser dans votre routine quotidienne. Elle aura également une valeur culturelle : des artistes ont déjà demandé à l’utiliser quand elle sera finie afin de créer des installations artistiques interactives.

Nouvelles communautés autour du datajournalisme
De nouvelles communautés se forment autour du datajournalisme (photo de Heinze Havinga)

Suite à RegioHack, nous avons remarqué que les journalistes considéraient le datajournalisme comme un complément viable au journalisme traditionnel. Mes collègues ont continué à utiliser et à développer les techniques apprises ce jour-là pour créer des projets plus ambitieux et plus techniques, tels qu’une base de données des coûts administratifs du logement. À partir de ces données, j’ai créé une carte interactive dans Fusion Tables. Nous avons encouragé nos lecteurs à jouer avec les données et nous avons crowdsourcé les résultats en ligne. En réponse aux nombreuses questions que nous avons reçues, j’ai également enregistré un tutoriel vidéo sur la création de cartes dans Fusion Tables.

Qu’avons-nous appris ? Beaucoup de choses, mais nous avons également rencontré beaucoup d’obstacles. Nous en avons identifié quatre.

Par où commencer : la question ou les données

Pratiquement tous nos projets piétinent quand nous nous mettons à la recherche d’informations. En général, tout commence par une question journalistique. Mais ensuite ? Quelles données sont disponibles ? Comment pouvez-vous y accéder ? Et quand vous avez trouvé ces données, permettent-elles de répondre à votre question ? Les journalistes savent généralement où trouver les informations qu’ils cherchent pour écrire un article. Mais en matière de datajournalisme, la plupart des journalistes ne savent pas quelles informations sont disponibles.

Manque de connaissances techniques

Le datajournalisme est une discipline relativement technique. Vous devrez être capable d’aspirer du contenu et de coder un peu pour visualiser vos résultats. Pour faire un excellent datajournaliste, il faut réunir deux aspects : l’instinct d’un journaliste expérimenté et le savoir-faire technique d’un bon généraliste numérique. À RegioHack, on n’en a pas croisé beaucoup de cette trempe.

Les informations sont-elles fiables ?

Les participants utilisaient pour la plupart une seule base de données pour trouver des informations, au lieu de chercher à recouper plusieurs sources. En effet, il faut quelques connaissances en matière de statistiques pour être capable de recouper des données.

Quelle est la routine ?

Ce qu’il faut retenir de tout ce qui précède, c’est qu’il n’y a pas de routine. Les participants maîtrisent quelques compétences, mais ne savent pas quand ni comment les utiliser. Un journaliste comparait cela à la cuisson d’un gâteau. « Nous avons tous les ingrédients : la farine, les œufs, le lait, etc. Nous jetons le tout dans un sac, nous le secouons et nous espérons qu’il en ressortira un gâteau. » Effectivement, nous avons les ingrédients, mais nous ne connaissons pas la recette.

Et maintenant ? Nos premières expériences de datajournalisme pourront servir d’inspiration à d’autres journalistes ou programmeurs aspirant à rejoindre le cercle, et nous travaillons à produire un rapport.

Nous songeons également à continuer RegioHack sous la forme d’un hackathon. Nous avons trouvé l’expérience amusante, productive et excellente en matière d’introduction au datajournalisme.

Mais pour que le datajournalisme trouve sa place, nous devons l’intégrer dans la salle de rédaction. Les journalistes doivent commencer à penser en termes de données, en plus des citations, des communiqués de presse, des réunions du Conseil, et ainsi de suite. En créant RegioHack, nous avons prouvé à notre public que le datajournalisme n’était pas qu’une mode passagère. Nous pouvons écrire des articles plus clairs et mieux informés tout en présentant les informations différemment sur le journal papier et sur le site web.

Jerry Vermanen, NU.nl