Quand la visualisation de données devient heuristique : deux exemples

ANAMIA egocenter corpus personalAu-delà du visuel pour le visuel et de la fascination de l’image, la visualisation de grands jeux de données est parfois un moyen de transmettre une nouvelle information. J’entends ici par “heuristique” cette capacité à mettre en évidence une information “globale” par l’organisation, hiérarchisation ou traitement d’autres informations (plus “locales”).

Exemple 1 : visualiser les résultats d’une enquête en sociologie

Multipliant les méthodes de recherche (analyses de réseaux personnels, enquêtes, cartographies du Web, entretiens, etc…), l’équipe d’ANAMIA (Paola Tubaro, Antonio Casilli et Fred Pailler - suivez-les sur Twitter !) s’intéresse à la sociabilité (en ligne, en particulier) de personnes souffrant de troubles alimentaires.

Antonio Casilli a récemment publié une série de vidéos qui détaillent un des aspects de leur démarche : un questionnaire en ligne qui permet aux sondés de recomposer leur réseau de sociabilité en ligne et hors ligne.

Ici, la première détaille l’exploitation des données issues du questionnaire à la manière d’un tableau circulaire qui conjugue plusieurs informations. La seconde donne au chercheur des clés d’interprétation du réseau personnel des sondés, un par un.

Exemple 2 : visualiser une minute d’échanges boursiers

60 seconds of chaos

Le studio Stamen propose une visualisation exceptionnelle (post original) de l’activité du Nasdaq pendant 1 minute (le 8 mars 2011, en l’occurrence).

Clé de lecture nécessaire : l’axe vertical (la valeur de l’échange) est d’échelle logarithmique, tout comme la taille des cercles (nombre d’actions).

Cette visualisation illustre la réalité du flash trading qui laisse à des ordinateurs les rênes des marchés financiers, qui en font usage en prenant de vitesse le trader traditionnel de part leur puissance de calcul et surtout leur vitesse exceptionnelle.

Commentaire

À mon sens, ces deux visualisations illustrent chacune à leur façon l’ambiguité générale de la visualisation de données (en particulier dans le milieu scientifique, même si elles ne sont pas les deux tirées de ce contexte) :

  • Réussite visuelle : le résultat est probant de lisibilité globale, on comprend parfaitement ce que l’auteur veut transmettre, à savoir dans la première un chevauchement des typologies (entre personnes très connectées mais au réseau peu dense et personnes au réseau minimal mais dense) et une grande diversité de profils, et dans la seconde une très grande complexité et rapidité des marchés boursiers dirigés par la main de fer de super-algorithmes.
  • Remise en question fondamentale : finalement, la visualisation n’est qu’un moyen de “montrer” une information qu’il n’était pas forcément nécessaire de mettre en image, ou du moins pas de cette façon. Dans le premier cas, un diagramme en barres aurait certainement suffit à rendre le corpus intelligible, et l’intérêt de l’interactivité du graphe de réseau ne semble pas au premier abord justifié par l’exemple de la vidéo. Dans le second cas, la masse d’information rend la visualisation impossible à comprendre autrement que comme une vision globale, sans moyen de se plonger dans les données. L’intelligibilité est d’ailleurs complètement desservie par les échelles logarithmiques qui ne permettent pas au lecteur de se faire une idée des ordres de grandeur.

ANAMIA egocenter corpus personalMais quelles que soient les louanges dithyrambiques ou les critiques formelles qu’on pourra leur appliquer, ces visualisations sont des exemples, à mon goût très réussis, de visualisations heuristiques : elles fondent un nouveau regard sur un corpus de données et permettent une nouvelle réflexion. Cette tension entre bienfaits et risques du visuel ne peut être une fois pour toutes dissipée (à l’image de mes propres travaux qui questionnent cette tension) et doit amener le chercheur à faire, par l’acte, la démonstration de l’effectivité de sa visualisation en tant qu’outil de recherche. Et c’est tant mieux !