Le Big Data Bang | Edition Multimédi@

Rien moins que le déluge ! Déluge numérique, déferlement de données, avalanche d’informations : les chiffres qui nous donnaient le tournis il y a à peine dix ans, nous semblent ridicules aujourd’hui. Pourtant, en 2010, on estimait que l’humanité – en produisant l’équivalent de 1.000 exabytes – faisait son entrée dans l’ère du zettabyte : un zettabyte équivalant à 1 milliard de terabytes. La croissance a été au rendez-vous, puisqu’en 2020 nous en sommes déjà à plus de 35 zettabytes ! Cette augmentation exponentielle est le résultat d’un emballement général. Les réseaux qui structurent le Web sont de plus en plus nombreux : après les données des institutions et des entreprises sur le Web de première génération, les données personnelles ont déferlé sur la Toile, amplifiées par la banalisation des réseaux sociaux diffusés sur tous les terminaux et les services mobile.
A cela, s’est ensuite ajouté le flux massifs d’informations libérées, comme les données publiques mises en ligne par les Etats ou les collectivités locales. Puis, ce fut au tour des milliards de « data » générés par l’Internet des objets. Nous apprenons à naviguer dans un espace numérique presque infini, composé de données hétérogènes : données non structurées, venues du monde entier, de plus en plus souvent produites en temps réel
et généralement taguées de mots-clés, de dates, de lieux, …

« Les algorithmes sont en mesure de faire émerger les motifs cachés des entrailles du Web : un Deep Web qui représente 90 % de l’ensemble du Net »