Guide du datajournalisme 1.0 BETA

Comment Regards Citoyens a créé NosDéputés.fr, base de données de l’activité parlementaire

En 2009, une bataille parlementaire se déroule autour du numérique à l’occasion des projets de loi Hadopi : des milliers de citoyens se mobilisent pour suivre les débats, en direct en ligne, voire physiquement à l’Assemblée. La toile commente et analyse alors les prises de paroles en hémicycle ou les amendements discutés. Beaucoup découvrent l’immensité des informations rendues publiques sur le site officiel de l’Assemblée nationale. Potaches ou sérieux, des citoyens jouent de leurs compétences informatiques pour réutiliser ces informations parlementaires et créer des sites internet dédiés à ce débat. D’autres utilisent leurs compétences pour pouvoir mieux préparer leurs visites de l’Assemblée et par exemple imprimer les milliers d’amendements sur quelques pages seulement afin de les apporter dans les tribunes de l’hémicycle et suivre les séances. Si les discussions sur Hadopi n’auront sans doute pas permis de régler les problèmes de modèles économiques rencontrés par l’industrie culturelle, elles auront autorisé de nombreux citoyens à prendre des « cours express » d’éducation civique et à mieux comprendre le fonctionnement de la démocratie parlementaire. Le débat Hadopi a généré malgré lui de nombreuses initiatives positives, mais elles sont majoritairement l’œuvre de techniciens capables de faire émerger, à partir de données informatiques, des informations sur l’expertise des parlementaires, la complexité du travail des députés, leur assiduité… L’idée de Regards Citoyens naît de cette question : seuls les citoyens doués de connaissances informatiques doivent-ils pouvoir avoir accès à ce type d’informations ? Un petit groupe décide donc de rendre accessibles à tous des outils permettant aux citoyens de mieux connaître le travail des parlementaires à l’Assemblée nationale : NosDéputés.fr.

En deux mois, ils explorent les sites officiels et créent sur leur temps personnel des routines informatiques pour récupérer et convertir automatiquement sous la forme de données brutes toutes les informations fiables officielles. Une règle est érigée en principe : les députés doivent tous être traités sur un pied d’égalité, toute information qui ne serait pas disponible pour l’ensemble des parlementaires est donc exclue. Les informations relatives aux députés ainsi que leurs amendements, leurs questions écrites ou orales, leurs interventions en hémicycle comme en commission, leurs rapports ou propositions de loi deviennent ainsi petit à petit les éléments d’une base de données renseignant avec des métadonnées précises l’activité de tous les parlementaires. Plusieurs milliers de comptes-rendus de séances sont convertis en centaines de milliers d’interventions de députés et rattachées aux projets de loi et amendements correspondants. La découverte dans les éditions du Journal officiel de relevés quotidiens des présences aux réunions de commissions permet à NosDéputés.fr d’offrir dès son lancement un jeu d’informations encore inédites, y compris sur le site officiel de l’Assemblée : l’implication des parlementaires au travail en commissions.

La majorité du travail consiste en de longues et fastidieuses tâches, appelées « scraping » par les communautés Open Data. Elles reposent sur la création d’outils permettant, à partir de documents, ici HTML ou PDF, souvent générés par des traitements de texte et édités à la main, de les convertir dans des formats structurés exploitables dans des tableurs ou des bases de données.

Une fois le scraping d’informations réalisé, le gros du travail est achevé. Il ne manque plus qu’une interface pour représenter la richesse des données extraites. Le site NosDéputés.fr est finalement prêt pour la rentrée parlementaire le 14 septembre 2009 et offre à chacun de nouveaux outils d’accès à ses élus : recherche de son député par code postal, comparaison des activités des députés par groupe politique, représentation sur un graphe de l’activité individuelle des députés, nuages des mots-clés les plus employés par un député au cours des débats indiquant son expertise, comptes-rendus de séances enrichis de liens contextuels, filtres multiples, alertes mails paramétrables selon des mots-clés, possibilité de commenter chacun des travaux réalisés par les parlementaires…

Afin de permettre à tous, journaliste, élu ou citoyen, de vérifier et contrebalancer les informations représentées, chaque élément est naturellement sourcé, mais également remis à la disposition de tous sous la forme de logiciels libres et de données Open Data (formats ouverts et licences libres). Chacun des algorithmes d’extraction, de décompte ou de représentation est ainsi vérifiable, réfutable et améliorable par chacun, assurant à un projet touchant à l’ensemble de la représentation politique une nécessaire neutralité. Si une dérive était introduite dans le logiciel, elle serait ainsi démontrable, et si les équipes de Regards Citoyens ne la corrigeaient pas, chacun aurait la possibilité de créer des alternatives plus neutres en reprenant les bases des logiciels publiés.

La remise à disposition de l’ensemble de la base de données en Open Data sous la forme d’un export complet et d’une API offre aussi la perspective de nombreuses réutilisations. Si Regards Citoyens se refuse à établir des classements des députés, jugeant impossible d’établir des critères objectifs pour évaluer le travail parlementaire, les données du site sont largement) réutilisées par les médias pour comparer l’activité des députés locaux ou établir des classements nationaux souvent controversés, suscitant parfois l’ire de certains responsables politiques. Au-delà de ces seuls palmarès, l’ensemble des informations contenues dans NosDéputés.fr permet des réutilisations médiatiques ou scientifiques bien plus riches : étude d’application des sanctions prévues au règlement pour les députés insuffisamment présents en commission, analyse par Le Monde de la proximité des députés entre eux en fonction des amendements cosignés sur le projet du mariage pour tous, recoupement de l’activité des députés avec leur pratique du cumul des mandats par des chercheurs, visualisations citoyennes des travaux des députés ou de leurs cumuls… Mais NosDéputés.Fr n’est plus la seule réalisation de Regards Citoyens. Toujours en appliquant ses principes de gouvernance ouverte (Open Data, logiciel libre et fonctionnement ouvert), l’association s’est également penchée sur l’impact politique du redécoupage électoral, la géolocalisation des bureaux de vote, l’activité des sénateurs, la publication en temps réel des résultats électoraux, le rôle joué par les parlementaires dans la modification des lois ou l’impact de l’activité des lobbyistes dans des travaux parlementaires via une opération de crowdsourcing… Dans chacun de ces projets, les membres de l’association sont confrontés à la difficulté d’accéder aux données publiques, souvent liée à un manque de culture informatique des administrations, ainsi qu’à la méfiance suscitée par les demandes de transparence. Reposant sur un fonctionnement entièrement bénévole, Regards Citoyens a donc également entrepris depuis 2010 un travail de plaidoyer sur l’Open Data et la transparence démocratique afin de mieux faire comprendre aux acteurs publics les problématiques rencontrées par les citoyens cherchant à valoriser le fonctionnement des institutions démocratiques. Avec le site NosDonnées.fr , l’association offre enfin un outil pour autoriser chacun, citoyen comme datajournaliste, à héberger et cataloguer les données qu’ils ont libérées et permettre ainsi à d’autres de les réutiliser.

Regards Citoyens