ACTUALITÉ SCIENTIFIQUE
ET INNOVATION DE L'ÉTS
Les bases de données : un outil et un défi en entreprise - Par : Faten M'Hiri,

Les bases de données : un outil et un défi en entreprise


Peu d’ingénieurs et d’hommes d’affaires ont résisté à la tentation de penser que les bases de données sont totalement indispensables dans notre vie courante puisqu’elles sont un des moteurs fondamentaux du progrès économique des entreprises actuelles. L’expression «base de données» est apparue vers 1964 pour désigner une collection d’informations partagées par différents utilisateurs d’un système d’informations militaire. En 1970, Edgar F. Codd apporte une contribution substantielle à cette définition en y introduisant les concepts de l’algèbre relationnelle donnant lieu aux «bases de données relationnelles». Il convient d’affirmer sans équivoque, que cette notion de bases de données relationnelles a été un apport significatif dans le domaine informatique, en permettant d’organiser efficacement l’information de l’entreprise. Dans cet article, le terme «base de données» sera utilisé pour désigner les «bases de données relationnelles».

D’une manière générale, une base de données est un dépôt informatique qui permet de sauvegarder l’information en format tabulaire conformément au modèle de données basé sur les règles de l’algèbre relationnelle. Le schéma ou modèle de données est la description de l’organisation des données à l’intérieur de la base de données. Il renseigne sur les caractéristiques de chaque type de donnée et les relations entre elles (voir Figure 1). Ce schéma peut être enregistré sur le disque de deux manières : soit enregistré par ligne ou bien par colonnes. La première méthode est la plus connue et aussi la plus utilisée (voir Figure 2). L’orientation par colonnes permet d’ajouter des colonnes plus facilement aux tables (voir Figure 3).

Figure 1 : Format tabulaire des bases de données relationnelles. Source [Img1].

Figure 1 : Format tabulaire des bases de données relationnelles. Source [Img1].

Figure 2 : Format tabulaire avec l’orientation par ligne. Source [Img2].

Figure 2 : Format tabulaire avec l’orientation par ligne. Source [Img2].

Figure 3 : Format tabulaire avec l’orientation par colonnes. Source [Img3].

Figure 3 : Format tabulaire avec l’orientation par colonnes. Source [Img3].

L’information habituellement stockée dans les bases de données est déterminante dans les activités de l’entreprise, car elle y soutient les prises de décisions. Aussi il est important de tenir compte des objectifs de l’entreprise pour trouver la meilleure information devant être enregistrée. Par exemple, une entreprise de livraison de documents de porte-à-porte peut considérer l’information des horaires de ses clients comme une information très importante, mais, pour un hôpital, cette information peut être considéré comme inutile. En fait, si toutes les données sont contenues dans un seul lieu, dans un système de bases de données, alors elles devraient être logiquement unifiées pour constituer un ensemble. Ce dernier  doit donc être bien conçu, bien géré et bien utilisé.

Parmi les avantages des bases de données dans les entreprises, on peut trouver en premier lieu la capacité de partager des données. Ceci signifie que plusieurs utilisateurs peuvent se servir simultanément des informations contenues dans la base de données en accédant tous à la même information et en l’utilisant chacun à des fins différentes (voir Figure 4).

Figure 4 : Différents clients peuvent accéder à la base de données. Source [Img4].

Figure 4 : Différents clients peuvent accéder à la base de données. Source [Img4].

En deuxième lieu, les bases de données permettent d’éviter les redondances de données. La redondance est une situation où les données sont répétées inutilement. Par exemple, une base de données peut avoir enregistré l’information sur les employés comme le nom, prénom, adresse, département, salaire, etc., et l’information sur les inscriptions aux cours de formation. Pour bien administrer les cours, il est nécessaire de connaître le département de chaque employé inscrit dans un cours. Évidemment, on n’a pas besoin de rentrer dans la base de données des informations comme la saisie de données, puisqu’elle peut toujours être obtenue par une requête pour les données des employés.

En troisième lieu, on peut aussi éviter les incohérences des données. Le terme incohérence signifie que deux ou plusieurs données dans la base de données contiennent des valeurs différentes. D’habitude, cette incohérence est le résultat de la mise à jour de données redondantes. Dans l’exemple ci-dessus, si les données du département de l’employé ont été stockées et une mise à jour de ce département a été faite, il y aurait un risque que la mise à jour touche uniquement la table «employé» sans que la table «cours de formation» soit mise à jour.

En quatrième lieu, on a la structuration des données. La base de données de l’entreprise doit à tout moment refléter la réalité le plus fidèlement possible, car cela aide à comprendre sa structure et sa fonction. La conception de la base de données est indispensable pour cette raison, et il est évident que la base de données doit montrer la réalité, pas le contraire.

En cinquième lieu, la base de données permet de fournir un accès effectif aux données. La base de données peut être parfaitement conçue et fonctionne de façon optimale, mais le vrai potentiel des bases de données est la possibilité de faire des requêtes qui peuvent combiner l’information de deux ou plusieurs tables (en utilisant le langage SQL). Dans l’exemple précédent, on peut avoir besoin de tous les employés inscrits dans un cours et un département particulier.

Finalement, les bases de données ont l’avantage de la sécurité, c’est-à-dire, la possibilité que l’administrateur applique des restrictions en matière de sécurité à différents aspects de la base de données. Par exemple, il peut définir des contrôles d’accès et des restrictions pour chaque utilisateur de l’information de la base de données.

Il est certain que les bases de données sont un outil d’information précieux qui peut être exploité efficacement pour générer des ventes et des profits. Lorsque les informations sur les clients sont connues, par exemple sur leurs niveaux de revenus, de consommation et en particulier sur leurs goûts, des informations utiles sont générées pouvant créer  des avantages concurrentiels.

Malgré tous leurs avantages, les bases de données sont loin d’être complètement développées.  En fait, elles présentent plusieurs défis que l’on se contentera de mentionner dans le paragraphe suivant et qui seront traités de manière approfondie dans de prochains articles.

Les défis actuels des bases de données

Gérer des bases de données oblige à prendre en considération les choix relatifs au stockage, à la sécurité et à l’utilisation. De nouvelles techniques et de nouveaux processus permettent de répondre aux besoins de gestion de l’information dans les entreprises. Les nouveaux concepts présentés ci-dessous peuvent être appliqués à la gestion de grands volumes d’informations tels que requis de nos jours :

  • Data Warehouse : Ce terme signifie simplement : «stockage de grands volumes d’informations». Dans la pratique, il consiste à faire usage de systèmes de stockage pour soutenir un environnement de sécurité pour l’information recueillie.
  • Data Mining: Cette technique permet d’extraire des informations à partir de bases de données existantes à des fins spécifiques de recherche d’informations.
  • Cloud Computing : Ce terme, qui signifie «informatique dans les nuages», réfère à l’utilisation de serveurs distants (souvent accessibles par l’internet) pour traiter ou stocker l’information. Actuellement, plusieurs entreprises pensent à transférer des données sur le Cloud Computing. Cette action pose de gros problèmes de sécurité pour les bases de données transférées.

Vidéo : Le défi d’adapter les bases de données au Cloud Computing

  • Big Data: Comme nous l’avons déjà vu dans le précédent article, le Big Data gère les ensembles de données de très grands volumes. Cette technique présente un grand défi car la base de données doit enregistrer beaucoup de données, à l’échelle de Téraoctets ou Pétaoctets, qui sont d’habitude totalement variées, comme des textes, des images ou des vidéos et qui nécessitent une réponse très rapide.
  • Le manque de sécurité: De nos jours, il est difficile de garantir une gestion de sécurité complète. De plus, il est difficile d’être sûr à 100% que les renseignements fournis par le consommateur ne seront utilisés que pour les fins autorisées.

Aujourd’hui, les bases de données sont indispensables dans les entreprises, car elles y soutiennent beaucoup de processus d’affaires. Elles doivent ainsi évoluer avec le marché actuel pour être à la hauteur des récentes demandes technologiques. Nous discuterons plus tard certaines des options conçues pour faire face à ces problèmes.

AbrahamGomezAvatarAbraham Gomez est chercheur en informatique et développeur de logiciels avec une vaste expérience dans la technologie Java. Ses centres d’intérêt  dans la recherche et ses publications se rapportent à l’intelligence artificielle et aux applications du « Cloud Computing » en se concentrant sur l’utilisation du « Big Data » dans les applications génétiques. Il a aussi une maîtrise en informatique et, actuellement, il est doctorant à l’ETS. Depuis 2011, il est membre de l’ISO-SC38, le groupe ISO qui travaille à construire une norme pour le « Cloud Computing ».

[accordion title= »Références des images » close= »1″]

  • Image d’entête : image de Rahul Kumar Ghosh, licence CC. Source.
  • [Img 1 à 4] : Image produite par l’auteur

[/accordion]