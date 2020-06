Je lis chez mes confrères étrangers, ici ou là, qu'il y aura un avant et un après Covid. Et chez nous? Autant le dire d'emblée, la Suisse ce n'est pas les Etats-Unis. Ici, les jeux de données sont moins accessibles ou moins complets, quand ils ne sont pas tout simplement payants. Les bases de données ayant un intérêt public ne se dénichent pas à chaque coin de site web. Malgré les intentions, l'open data sauce helvétique s'apparente aujourd'hui plus à un fantasme qu'à une réalité. Et pourtant…

Il y a ne serait-ce que trois mois en arrière, le terme "data-journaliste" faisait au mieux soulever des sourcils curieux, au pire écarquiller des yeux interloqués. Il aura fallu une pandémie pour que les internautes se prennent de passion pour ces courbes, pour ces chiffres qui évoluent jours après jours et qui donnent le tournis. Ces données, ils les ont commentées, disséquées, analysées, critiquées.

Le dashboard 100% data mis au point par mes collègues a cumulé plus de 800000 vues. Chaque article traitant de données a intéressé plus de 23000 personnes au minimum, soit mieux que bien des articles "classiques". La demande est donc là. Bien réelle. Et la leçon est claire: le grand-public est friand d'informations concrètes, chiffrées et remises en perspective. La relation qu'entretiennent les gens avec les chiffres a évolué et les journalistes ont le devoir de s'engouffrer dans cette brèche numérique. Le data-journalisme n'est plus un gadget pour journaux en crise mais est devenu un genre à part entière, adoubé par les lecteurs.

En ces temps de défiance envers les médias, le journalisme de données apparaît comme fiable. Mais le grand public ignore encore ce que les data journalistes peuvent faire avec quelques lignes de code informatique. Ils pensent par exemple encore trop souvent que seuls les chiffres nous servent de matière première, c'est faux. Les mots aussi peuvent devenir une précieuse base de travail. J'ai par exemple utilisé un algorithme pour analyser puis comparer les discours officiels français et suisses durant la pandémie. L'idée était de visualiser quels verbes étaient utilisés en majorité, quelle sémantique était employée et à quels moments. Plusieurs milliers de lignes ont ainsi été passées au crible et le résultat s'est avéré très intéressant. Cet article a été lu par plus de 25000 personnes.

Nous avons pu mettre en évidence l'avance de la Suisse sur la gestion de la crise par rapport à sa voisine hexagonale. Le Conseil fédéral a par exemple été le premier à aborder la problématique du masque, tandis que ce mot n'a fleurit dans le discours d'Emmanuel Macron que deux semaines plus tard. Dans le même esprit, le président français a soigneusement évité de prononcer le terme "Covid-19", tandis que le gouvernement suisse n'a pas craint un seul instant d'employer un vocabulaire technique. Les verbes employés ne se ressemblent pas non plus: "dire", "faire" ou "continuer" côté français, contre "prévoir* ou "protéger" côté helvète au même moment.

L'analyse data des mots, appelée "natural langage processing" ou traitement automatique du langage naturel en français, est par exemple utilisé par les data scientists du Centre européen de prévention et de contrôle des maladies (ECDC): en scannant les messages laissés sur les réseaux sociaux, ils arrivent à voir en direct l'apparition et la propagation des maladies infectieuses telles que le Covid-19 sur le territoire européen.