Big Data et moteur de recherche
Big data et moteur de recherche
Evoqué pour la première fois en 2008 par le Cabinet d’études Gartner, l’expression « big data » est devenue populaire depuis le début de cette année. Le Big data désigne le phénomène d’une véritable explosion des volumes d’informations ou de données informatiques à traiter par l’entreprise. L’avènement récent du web 2.0, l’engouement mondial concernant les smartphones et tablettes et l’internet mobile ont beaucoup participé au phénomène. On associe généralement trois problématiques majeures dans la définition du big data : les volumes des données, la variété des sources, et la vélocité.
Big data et les trois « V »
Pour les entreprises, les volumes de données qui circulent sur Internet actuellement peuvent servir d’informations de base pouvant influer les prises de décisions stratégiques. Les solutions de big data agissent comme moteurs de recherche « intelligents », permettant de traiter et d’exploiter d’énormes volumes de données, afin de transformer celles-ci en une base de données structurées et donc, exploitables. Ces données peuvent provenir de différentes sources.
En effet, la variété des sources d’informations augmente de jour en jour, avec l’évolution des terminaux mobiles et appareils connectés : smartphones, tablettes, compteurs électriques, bornes Wi-Fi, objets connectés… ; produisant des données homogènes (bases de données, applicatifs métiers…), ainsi que des données non structurées : emails, documents, fichiers audio et vidéo, forums de discussion… Selon le leader mondial des réseaux Cisco, le volume annuel du trafic Internet atteindra les 966 exaoctets en 2015.
Le dernier « V » concerne la vélocité : pour invoquer la nécessité, via le big data, de prise de décisions rapide en entreprise, afin de ne pas se faire devancer par la concurrence.
Big data : supplanter les moteurs de recherche ?
Les autres moteurs de recherche, comme Google, s’appuient uniquement sur la popularité « statistique » d’une information sur Internet. Les solutions de Big data se basent sur des moteurs de recherche développés spécialement pour les recherches « professionnelles », apparentées à la veille en entreprise. Pour pouvoir analyser des informations fortement hétérogènes et à grands volumes, le big data repose sur différentes technologies : formats de bases de données non relationnelles NoSQL, mémoires DRAM ou flash, bases de données massivement parallèles, framework open source de traitement de données massives comme Hadoop. En attendant, les moteurs de recherche historiques sont encore les préférés des internautes.