Qu’est-ce que le Big Data ?

Le Big Data est un phénomène qui a débuté en 2012 et qui va continuer son développement en 2014.

Le postulat du Big Data est simple : la donnée, sous toutes ses formes, est considérée comme une matière première, comme un capital dont l’entreprise regorge mais qu’il faut savoir exploiter pour pouvoir la valoriser.

La définition de Wikipédia pour le Big Data est la suivante :

« Big data, littéralement les Grosses données, est une expression anglophone utilisée pour désigner des ensembles de données qui deviennent tellement volumineux qu’ils en deviennent difficiles à travailler avec des outils classiques de gestion de base de données.

Dans ces nouveaux ordres de grandeur, la capture, le stockage, la recherche, le partage, l’analyse et la visualisation des données doivent être redéfinis. »

Il s’agit donc d’un ensemble de technologies, d’architecture, d’outils et de procédures permettant à une organisation de très rapidement capter, traiter et analyser de larges quantités et contenus hétérogènes et changeants, et d’en extraire les informations pertinentes à un coût accessible.

Le Big Data couvre 3 dimensions importantes : Volume, Variété, Vitesse

Des volumes de données dans les Systèmes d’Informations qui augmentent sans cesse

En effet, le monde crée de plus en plus de données chaque jour et ces données sont conservées sur des profondeurs d’historique beaucoup plus importantes. Leur niveau de granularité est de plus en plus fin et de nombreux supports sont dématérialisés.

Des nouveaux formats de données, plus variés, à intégrer et à analyser

La tendance était jusqu’à présent de structurer le plus possible les données à intégrer dans les Systèmes d’Information pour en faciliter le stockage et le traitement. Des outils tels que les ETL (Extract Transform and Load) permettent de normaliser, de structurer les données avant de les intégrer dans les Systèmes d’Informations. Or de nouveaux formats de données toquent à la porte des entreprises, bien décidés à prouver leur importance dans la stratégie de l’entreprise et dans la prise de décisions.

Des données à collecter et à analyser en temps réel

Ces nouvelles données sont produites en flux continu (données produites sur les réseaux sociaux, données produites par des capteurs), et doivent donc être traitées quasiment en temps réel car elles s’intègrent pour certaines dans des processus sensibles au temps : analyse des données météorologiques en temps réel pour anticiper des catastrophes naturelles, gestion des fraudes par exemple. D’une manière générale, les décideurs ne se contentent plus d’avoir des données à J+1.

Quelques domaines d’utilisation du Big Data

  • Le  Marketing, le Big Data permet d’améliorer la connaissance du client : analyse du comportement client, micro segmentation, analyse multicanale, …
  • Les Sciences, le Big Data permet de traiter et d’analyser des volumes de données importants pour la recherche médicale (la recherche génétique génère 1To  de données par expérimentation), pour l’analyse des données météorologiques issues des capteurs,  …
  • La Finance, le Big Data permet d’améliorer les temps de traitement et donc les temps de réaction dans des processus chrono-sensibles comme la gestion des risques ou la gestion des fraudes.