Big Data : l’enjeu de l’exploitation des données






3 Juin 2013

Imaginez chercher de visu un ouvrage dans une bibliothèque où les livres ne procéderaient d’aucune logique de rangement, qui plus est dans des rayons immenses et parfois classés de manière aléatoire. C’est le défi que propose de relever le projet de Big Data.


La gestion Big Data

Le principe du Big Data est de permettre le traitement de la quantité astronomique de données produites, diffusées et amassées depuis l’apparition de l’informatique et au fil des évolutions technologiques. S’est en effet engagé un processus visant à dégager une pertinence et un sens dans cette masse d’informations. Des analyses qui sont évoquées sous la dénomination de Big Analytics ou en français, Broyages de données.
 
En entreprise, le Big Data regroupe la récolte et l’exploitation de données internes (fiches clients, fournisseurs, gestion des stocks, etc.) mais aussi de celles, externes (information sur des salons, sur des concurrents). Cet ensemble est pensé selon une logique qui peut être synthétisée par la notion des « 3 V », c’est-à-dire Volume, Variété et Vélocité. Au-delà de ces principes, on peut dégager l’intérêt primordial de donner un sens aux informations disponibles afin de les exploiter correctement. Ainsi, il est essentiel de mettre en place une architecture de stockage afin d’utiliser les données. Et l’apport d’une intégration de cette gestion au sein même de l’entreprise tient en ce qu’il concerne tous ses pôles. Chacun peut donc bénéficier d’un avantage dans « la connaissance de leur connaissance ». La relation avec le client est en outre repensée, puisqu’une source considérable d’interaction avec celui-ci est possible via Internet. L’objectif est donc de cherche l’efficacité, l’efficience.
 
Pourtant, la gestion de ce Big Data n’est pas évidente pour toutes les entreprises. Selon un rapport d’EMarketer, en 2012, si 23% des DSI des entreprises américaines annonçaient avoir récolté des informations auprès de leurs clients, seulement 46% de ceux-ci estimaient avoir les capacités d’exploiter correctement les données collectées. C’est là toute la problématique du Big Data.

Des entreprises souvent en difficulté face au Big Data

Les données (data) n’ont de valeur pour l’entreprise que si elles sont analysées. Brutes, elles ne représentent qu’un bloc qu’il faut dégrossir grâce à de plusieurs outils spécifiques. Outre cette nécessité d’analyse, il faut prendre en compte la volatilité des données stratégiques, puisque celles-ci ont un caractère périssable, et présentent alors une exigence de mise à jour importante (c’est par exemple le cas des fiches clients, les personnes peuvent avoir changé de poste ou d’adresse de courriel). C’est ici un second enjeu du Big Data, après celui de l’analyse.
 
Par ailleurs, il existe bien d’autres problèmes concernant la gestion des données en entreprise. Tout d’abord, les informations doivent être de qualités pour être exploitées convenablement. Ensuite, les saisies manuelles sous-entendent des erreurs, les différences de formats des données (.pdf, .xls, .doc et autres) empêchent une lecture uniforme et donc rapide, et enfin il n’y a que peu de personnes qualifiées au sein des entreprises, même dans les directions des systèmes d’information, pour exploiter et évaluer convenablement les sources.
 
A ces problématiques, il est possible de proposer un certain nombre de réponses, dont celle du datamining ou « exploration des données ». Le marché est en pleine expansion et de nombreuses solutions logicielles ont vu le jour, permettant notamment une analyse prédictive en agrégeant et décortiquant les données disponibles. Pour autant, le manque de personnes formées à ces outils, en France, retarde l’implantation de ses applications dans le monde de l’entreprise.

Le prochain grand défi mondial : organiser les données

Le Big Data est en réalité la troisième révolution informatique, après la première d’ordre quantitative dont IBM était le fer de lance avec les esquisses originelles de ce qui deviendra l’ordinateur. Une seconde consacra la création du réseau Internet, du protocole http et de ses composantes. La troisième, à laquelle nous assistons est la fulgurance des réseaux sociaux et du développement des données et de la capacité de leur stockage. Le phénomène du Big Data s’inscrit dans cette logique et vise ainsi à traiter efficacement et pertinemment le problème qui se pose actuellement pour l’exploitation des données, qui est d’ailleurs révélateur de la dynamique dans laquelle nous nous trouvons actuellement. Nous possédons de manière croissante les moyens d’avoir accès à un nombre considérable de données, notamment grâce à Internet, et pourtant la portée stratégique de ces données en est fortement réduite voire inopérante, lorsqu’on ne dispose pas d’un système permettant une exploitation correcte de celle-ci.
 
Parallèlement, les données sont bien plus exposées qu’auparavant. Les ordinateurs et les réseaux d’entreprises peuvent être pénétrés par des personnes extérieures via Internet ou par connexion à distance. Les smartphones et les tablettes tactiles, où les logiciels antivirus et de protection de réseau ont tardé à se développer, présentent de nombreuses failles de sécurité, d’autant plus qu’ils sont mobiles et donc poreux à des infiltrations à tout endroit où ils sont présents, dès lors qu’ils fonctionnent. Aussi faut-il être vigilant quant à la préservation des données que l’on transporte sur les appareils mobiles, ainsi quel celles qui circulent sur les réseaux d’entreprise. Il est donc nécessaire de mettre en place une série de verrous et de cryptages afin de protéger les données, qui deviennent par ailleurs un élément central de l’économie virtuelle, comme on peut le constater avec la valeur qu’obtiennent les informations à caractère privé.