Comment archiver le Web ?

3 janvier 2012

A l’occasion des Ateliers Méthodologiques du dépôt légal du Web, Hubert Guillaud, rédacteur chef d’InternetActu, et Olivier Ertzscheid, maître de conférences en Sciences de l’information et de la communication, ont réfléchi à la façon dont nous « faisons mémoire » sur Internet.

> Beaucoup trop de données : vraiment plus assez de pensées

Le vertige des métriques, cette somme incommensurable de données produites à chaque seconde sur Internet, soulève des questions. C’est ce que montre Hubert Guillaud : « le Web est une machine à produire du chiffre […] dont la valeur nous échappe », à tel point que nous ne questionnons plus leur pertinence.

Deux milliards d’Internautes, cinq cent millions de sites web… Les chiffres donnent le vertige.

Olivier Ertzscheid souligne qu’ils posent de réels problèmes à la mémoire du web :

Comment trouver sa place : contrôler ses traces, faire mémoire sur le Web ?

– Que faire en tant qu’individu devant de tels chiffres : c’est le problème du renoncement, de la capitulation, de la délégation.

– Comment cartographier de façon lisible et neutre cette masse immense ?

> Utilité de l’archive publique : volonté numérique

Dans son exposé, Olivier Ertzscheid souligne que notre processus de mémoire relève désormais d’une logique algorithmique et non plus archivistique. C’est un changement profond : on passe d’une mémoire algorythmique, où les choix se faisaient à partir d’une formule (un choix de départ),, à une mémoire archivistique, où l’individu dispose d’un cadre à l’intérieur duquel il fait des choix.

Ces deux logiques ont des impacts forts sur la façon dont nous accédons aux données. C’est ce qu’Olivier Ertzscheid désigne par l’opposition entre watching et matching. L’archiviste propose un « watching », ou vue sur le monde, explicite, qui conditionne le « matching », ou la capacité des documents à être retrouvés. Alors que les algorithmes fonctionnent par « matching » et impose un « watching » implicite et dissimulé.

En d’autres termes et comme l’écrivent très bien Olivier Ertzscheid et Gabriel Gallezot, « quand nous consultons une page de résultats […], nous ne disposons pas simplement du résultat d’un croisement combinatoire binaire entre des pages répondant à la requête et d’autres n’y répondant pas ou moins (matching). Nous disposons d’une vue sur le monde (watching) dont la neutralité est clairement absente. »

Les deux intervenants concluent en suggérant de :

– confier aux archives publiques le rôle de documenter la mémoire du web,

– veiller à ce que le web reste une mémoire supplétive, qui complète les autres mémoires, et qu’elle ne devienne pas une mémoire privative,

– ne pas oublier l’importance de se souvenir, même lorsque l’on ne peut plus tout se rappeler.

Chaque semaine,
recevez les immanquables
par email