Guide du datajournalisme 1.0 BETA

Le hackathon Mapa76

Mapa76
Mapa76 (Hacks/Hackers Buenos Aires)

Nous avons créé la section de Hacks/Hackers à Buenos Aires en avril 2011. Nous avons organisé deux réunions initiales pour promouvoir une meilleure collaboration entre journalistes et développeurs de logiciels, qui ont chacune réuni entre 120 et 150 personnes. Comme troisième rencontre, nous avons organisé un hackathon de 30 heures avec huit personnes au cours d’une conférence sur le journalisme numérique dans la ville de Rosario, à 300 kilomètres de Buenos Aires.

Un thème qui revenait souvent au cours de ces réunions était le désir d’extraire de grands volumes de données du Web et de les représenter visuellement. Dans cette optique, nous avons lancé un projet appelé Mapa76.info pour aider les utilisateurs à extraire des données puis à les afficher à l’aide de cartes et de frises chronologiques. Une tâche tout sauf facile !

Pourquoi Mapa76 ? Le 24 mars 1976 s’est produit un coup d’état en Argentine, installant une dictature qui a duré jusqu’en 1983. Au cours de cette période, on estime qu’environ 30 000 personnes ont disparu, des milliers sont mortes et 500 enfants sont nés en captivité et ont été volés par la dictature militaire. Plus de 30 ans plus tard, le nombre de personnes condamnées pour crimes contre l’humanité au cours de la dictature en Argentine s’élève à 262 (septembre 2011). Il y a actuellement 14 procès en cours, dont 7 avec des dates d’ouverture définies, impliquant 802 personnes.

Ces procédures génèrent de grands volumes de données, difficiles à gérer pour les chercheurs, journalistes, organisations de défense des droits de l’homme, juges, procureurs et autres. Les données sont produites par une multitude d’acteurs et ne sont pas centralisées, et les enquêteurs se font rarement aider d’outils logiciels pour les interpréter. En conséquence, beaucoup de faits sont négligés et les hypothèses sont souvent limitées. Mapa76 est un outil d’investigation offrant un accès complet à ces informations à des fins journalistiques, juridiques et historiques.

En préparation du hackathon, nous avons créé une plate-forme pour que les développeurs et les journalistes puissent collaborer le jour de l’évènement. Martin Sarsale a développé quelques algorithmes de base pour extraire des données structurées à partir de documents texte simples. Quelques librairies du projet DocumentCloud.org ont également été utilisées. La plateforme pouvait analyser et extraire automatiquement les noms, dates et lieux à partir des textes – et permettait ensuite aux utilisateurs d’explorer les faits importants de chaque affaire (par exemple : date de naissance, lieu de l’arrestation, lieu présumé de la disparition, etc.).

Notre but était de créer une plate-forme permettant d’extraire automatiquement les données des procès de la dictature militaire en Argentine. Nous voulions offrir un moyen d’afficher automatiquement (ou au moins semi automatiquement) les données-clés des affaires de la période 1976-1983 basées sur des preuves écrites, des plaidoiries et des jugements. Les données extraites (noms, lieux et dates) étaient recueillies, stockées et pouvaient ensuite être analysées et affinées par le chercheur, ou encore être explorées à l’aide de cartes, de frises chronologiques et d’outils d’analyse en réseau.

Le projet permettra aux journalistes et aux enquêteurs, aux procureurs et aux témoins de suivre l’histoire de la vie d’une personne, y compris l’évolution de sa détention et sa disparition ou libération consécutive. Si des informations viennent à manquer, les utilisateurs ont la possibilité de parcourir un grand nombre de documents potentiellement liés à l’affaire. Pour le hackathon, nous avons publié une annonce par le biais de Hacks/Hackers Buenos Aires, qui comptait alors environ 200 membres (au jour de l’écriture [en 2011, NdT], on en dénombre environ 540). Nous avons contacté de nombreuses organisations de défense des droits de l’Homme. Environ 40 personnes ont assisté à la réunion, y compris des journalistes, des organisations de défense, des développeurs et des designers.

Au cours du hackathon, nous avons identifié les tâches que les différents types de participants pouvaient effectuer indépendamment. Par exemple, nous avons demandé aux designers de travailler sur une interface combinant des cartes et des frises chronologiques, aux développeurs de concevoir un moyen d’extraire des données structurées et des algorithmes pour désambiguïser les noms, et aux journalistes de s’intéresser à ce qu’il était advenu de certaines personnes en particulier, de comparer les différentes versions d’une histoire et de passer des documents au peigne fin pour raconter des histoires sur des affaires précises.

Le principal problème que nous avons rencontré après le hackathon, c’est probablement que notre projet était très ambitieux, que nos objectifs à court terme étaient exigeants, et qu’il était difficile de coordonner un réseau informel de bénévoles. Pratiquement toutes les personnes impliquées dans le projet avaient déjà un travail à plein temps et participaient à d’autres projets et évènements. Hacks/Hackers Buenos Aires a tenu neuf réunions en 2011. Le projet est actuellement en cours de développement. Un noyau dur de quatre personnes travaille avec plus d’une douzaine de collaborateurs. Nous avons une liste de diffusion et un dépôt de code source permettant à tous ceux qui le souhaitent de prendre part au projet.

Mariano Blejman, Hacks/Hackers Buenos Aires