#Infolab - Pour une culture visuelle de la donnée.
Avec la “Campagne Infolab” de la Fing, nous engageons une phase exploratoire sur les outils, méthodologies et méthodes d’animation du travail de la donnée (quelle soit publique, privée ou personnelle). Poussés par ce dessein et notre curiosité, nous étions mardi 16 au rendez-vous des professionnels de la visualisation de données, Visual Decision. Pour engager cette demi-journée, Karen Bastien (Journaliste ex-Libération, ex-Owni) de WeDoData et Christophe Tricot (Spécialiste cartographie sémantique, etc.) de Syllabs nous ont présenté deux projets, nés de leur jeune collaboration, autour de la thématique de Narration visuelle et Interactivité. Le public de la manifestation était majoritairement composé de professionnels de la Business Intelligence (bigdata, datamining ) et de quelques designers d’information (graphiste, cartographe, consultant). Nous vous proposons un retour d’expérience sur cette collaboration, mêlant l’intelligence analytique du journaliste, le travail technique de défrichage des données du développeur et l’exégèse graphique du designer, qui a su dans son format activer discussions et débats. Les thémes de réflexion explorés et les problématiques soulevées ont su esquisser de futurs champs d’action pour l’Infolab.
La difficile lecture des représentations exposées, par les acteurs du business et du data mining, a déclenché un débat de fond impliquant la culture visuelle des lecteurs et donc du public ciblé. Un cahier des charges éclairé ainsi qu’un travail attentif de l’expérience utilisateur se sont avérés, au fil de la discussion, nécessaire à une pedagogie par l’image. De surcroit, la question de l’inscription d’une dataviz au sein d’un chemin de fer (sur support papier) ou d’une navigation web est trop peu identifiée. Bien souvent, les acteurs de la donnée n’ont pas conscience que leurs datavizs s’inscrivent avant et/ou après un contenu textuel. De fait, l’argument d’un visuel, plus impactant qu’un texte descriptif, prôné par les datajournalistes (“le lecteur n’a pas à lire, il ne comprend pas forcement mieux ce qu’il voit, mais il comprend plus vite”) est souvent une fausse bonne idée. L’utilité de la dataviz reste encore à définir, pour l’heure, elle n’apparaît qu’en complément ou synthèse d’un corpus de texte. Aussi, elle n’est pas une aide à la décision ou un moyen d’action, mais une nouvelle modalité éditoriale qui se cherche.
Après une interrogation sur les représentations de la donnée, le dialogue s’est ouvert sur les différences engagées entre une publication de dataviz sur le web ou sur support papier. Le print, n’étant pas “interactif”, exige un nécessaire temps d’adaptation et engage de la part du lecteur une production de sens ; le web, ouvrant à un dialogue moins encadré et donc plus spontané, alimente souvent l’argument d’une réappropriation du savoir grâce à l’éditorialisation de la dataviz (ou à d’autres formes d’interactivité) qui n’est pas toujours vérifiable ni vérifié.
La question de la transparence ou de l’honnêteté de la démarche a alors été soulevée, la construction de la dataviz n’étant pas nécessairement, suivant les lecteurs, voulue explicite et/ou lisible. Doit-on rester dans une logique de “boîte noire” sous pretexte que le lecteur final n’a pas besoin de tout savoir ? Les acteurs rassemblés ne voyaient pas l’intérêt d’une documentation autour du travail de la donnée (D’où viennent les données? Quels corpus de départ et de fin? Quels traitements statistiques?). Pourtant la déontologie du journalisme, impliquant le travail d’éditorialisation, de scénarisation et de subjectivité, pousserait à dépasser l’objectivité du chiffre que génère la dataviz.
En définitif, les professionnels de la donnée se doivent encore de progresser quant à leur rencontre avec des lecteurs plus ou moins alertes. Le numérique tout en étant une magnifique opportunité peut également se faire outil d’exclusion s’il est déployé sans tenir compte du contexte sociétal. Cet évènement est également révélateur de la demande des professionnels business d’enrichir leur culture graphique de la visualisation de données. L’accompagnement et la sensibilisation aux jeux de données se révèlent donc primordiales pour réinventer les modalités de communication et de débat.
WeDoData & Syllabs pour Visual Decision from ChristopheTricot
Synthèse des deux projets présentés par Karen Bastien & Christophe Tricot :
Le premier projet présenté par Karen Bastien et Christophe Tricot est 50 ans d’amitié franco-allemande, un projet réalisé pour Radio-France en vue d’une programmation spéciale, commémorant les cinquante ans du traité de l’Elysée. Aussi, « Comment traiter de façon originale un évènement politique et diplomatique tel que celui-ci ? Comment explorer 50 ans d’Histoire commune sous un nouvel angle ? Les chef d’Etats ont-ils toujours eu le même discours ? Les éléments de langage – même diplomatiques – ont-ils évolué au fil du temps ?». L’analyse sémantique des 134 discours qui ont rythmé ce bilatéralisme s’est imposée d’elle-même comme matière première. Nous y avons alors vu un travail d’investigation journalistique, reposant sur des données chiffrées, capitalisées, confrontées puis problématisées et exposées, ayant pour intention première l’alimentation objective d’un article. Sur ce corpus de texte, 25 termes finaux dit termes « saillants » ont pu émerger grâce aux méthodes TF-IDF. Deux types de visualisation dynamique, explorant un terrain éditorial innovant, ont alors permis d’aborder l’évolution des mots dans le temps. Il s’agit bien de trouver de nouvelles dynamiques de communication, entre le fond, la forme et l’interactivité, plus impactantes q’un texte descriptif. La première représentation exposait l’évolution de l’ensemble des 25 termes « saillants » de 1962 à 2013, la seconde permettait l’exploration de l’évolution quantitative d’un terme de manière chronologique ainsi que ses principales cooccurences.
Dans le cadre d’une publication dans la revue TANK (voir la dataviz ici), WeDoData et Syllabs se sont une nouvelle fois alliés pour mettre en lumière la notion d’e-réputation. La matière première a cette fois-ci été compilée par Laurence Houdeville (consultante en e-reputation) au sein d’une veille contenant article de blogs, médias spécialisés et grand public, enrichie par un crawl automatique développé par Syllabs. Ce corpus de 346 789 mots a permis, à travers l’extracteur terminologique, la détection de trois thématiques « saillantes » : la notoriété, le droit à l’oubli et le bad buzz. Cette analyse sémantique a révélé de nombreuses coalescences, un calcul de proximité a alors été effectué. Trois types de représentation se sont alors annoncés nécessaires à la lecture des données : une évolution temporelle des thèmes, une cartographie des thèmes et la quantification d’un thème juridique particulier dans l’ensemble.
> Retrouvez le storify de l’évènement ici.
Loup Cellard & Faustine Bougro.
















