Introduction à la visualisation de données : l’analyse de réseau en histoire

ABSTRACT

L’utilisation de la visualisation de données en histoire engendre des réactions contradictoires : alors que certains sont fascinés par son potentiel heuristique à en oublier leur sens critique, d’autres rejettent par principe ces pratiques, les suspectant de cacher un vide explicatif.
Cet article introduit la distinction entre visualisation de démonstration et visualisation de recherche, rappelant que le chercheur ne doit pas uniquement utiliser la visualisation comme moyen de communication, mais également pour nourrir la recherche elle-même. C’est particulièrement dans sa forme la plus complexe, l’analyse de réseau, que cette catégorie de visualisations de recherche va être discutée.

COMMENTAIRE

À vocation introductive, à la manière des interventions pour lesquelles on me sollicite fréquemment et qui ne peuvent hélas qu’effleurer les bases de ce vaste champ, cet article se déroule en deux temps : un premier qui met en garde face aux visualisations qui trahissent une méconnaissance de la sémiologie graphique et dresse une typologie des usages (voir résumé ci-dessous), et un second qui s’attache à montrer en quoi, dans mes propres recherches, l’analyse de réseau peut être considérée comme un outil de recherche soulevant de nouveaux questionnements sur les données.

TYPOLOGIE DES VISUALISATIONS DE DONNÉES

Il faut distinguer les visualisations qui découlent d’un savoir scientifique et les visualisations qui créent un savoir scientifique :

DÉMONSTRATION RECHERCHE
La visualisation de données est un moyen puissant de résumer une situation ou un résultat. Ses vertus sont indéniables à des fins pédagogiques ou de communication, pour autant qu’elle ne tronque pas le matériau dont elle est le produit. La visualisation est parfois un moyen de faire surgir de nouvelles questions de recherche d’un jeu de données très complexes et à première vue inintelligibles. Elle n’est pas un produit fini mais est une porte d’entrée, pas toujours destinée à être publiée.

On distingue également les visualisations selon la nature de leur source, visualise-t-on une information ou un jeu de données ?

INFOGRAPHIE VISUALISATION DE DONNÉES
Un organigramme de comité de direction renseigne son lecteur en lui fournissant une information visualisée. Une “infographie” est le fruit d’un travail graphique, elle devient un vecteur d’information. Un histogramme d’évolution démographique met à disposition de son lecteur l’expression visuelle de données. Ce n’est pas un travail d’illustration, il est guidé par les données elles-mêmes.

Ces typologies se déclinent également en analyse de réseau, l’une des formes les plus complexes et aboutie de visualisation de données :

RÉSEAU RECONSTRUIT RÉSEAU DES DONNÉES
Le réseau “reconstruit” est le fruit d’une compilation d’informations : le chercheur interprète ses sources et dessine le réseau qui s’y tisse : telle personne semble liée à telle autre, est membre de la même commission scientifique, etc. C’est une approche traditionnelle qui fait ses preuves. Le réseau “des données” est un réseau qui est déjà présent dans les sources : un fonds de correspondances n’est en fait qu’une vaste liste de couples “expéditeur-destinataire” que l’on peut analyser et visualiser indépendamment de l’organigramme figé des personnes concernées dans un champ donné.

ARTICLE

Grandjean, Martin
Introduction à la visualisation de données : l’analyse de réseau en histoire
Geschichte und Informatik, 18/19, 2015,
pp. 109-128.

Version PDF complète

[PDF] Academia

 [PDF] ResearchGate

Vers le numéro de revue

Graphe du réseau des acteurs des milliers de documents du fonds de la Commission Internationale de Coopération Intellectuelle (SDN) : plus de 800 personnes reliées par près de 6000 arêtes (représentant plus de 10000 relations, les arêtes s’épaississent propor- tionnellement au nombre d’apparitions simultanées de personnes comme acteurs d’un même document). La taille des cercles est fonction du degré de centralité des personnes (le nombre de connexions qu’elles entretiennent) alors que la couleur indique leur centralité d’intermédiarité (mesure, sur tous les chemins possibles dans le réseau, la proportion de chemins qui passent par cet acteur et ren- seigne ainsi sur sa potentielle fonction de « pont » dans le réseau en question).

Graphe de réseau : la taille des cercles est fonction de le centralité de degré, leur couleur de leur centralité d’intermédiarité.

Plan du réseau de métros parisiens.

Plan du réseau de métros parisiens.

La généralisation du graphique comme moyen d’expliciter un corpus de données s’accompagne, en particulier dans les disciplines peu familières au traitement d’informations chiffrées, de nombreux contre-exemples, erreurs et visuels contre-intuitifs.

La généralisation du graphique comme moyen d’expliciter un corpus de données s’accompagne de nombreux contre-exemples, erreurs et visuels contre-intuitifs.

 
ALLER PLUS LOIN
Dans le même numéro et sur le même sujet, je vous invite à lire également les contributions suivantes :

  • Christofoli Pascal, “Principes et usages des dessins de réseaux en SHS”, p.23
  • Andurand Anthony, Jégou Laurent, Maisonrobe Marion et Sigrist René, “Les mondes savants et leur visualisation, de l’Antiquité à aujourd’hui”, p.59
  • Faraut Vivien, “Préparer l’insurrection: le réseau relationnel des carbonari lors de la conspiration de la Rochelle”, p.95

 

Je me réjouis de savoir ce que vous pensez de cette typologie, n’hésitez pas à laisser un commentaire ci-dessous !