Utilité d'un DataWareHouse :
Il est de bon ton pour toutes entreprises de réagir rapidement en termes de décisions statégiques. La capacité d'avoir un visuel constant sur l'état des données transactionnels relève d'une gestion précise et élaborée de son système d'information. La transformation du système de production (SGDB) en S.I décisionnel consiste en l'intégration de données provenant de différentes sources en les groupant et en les organisant de façons a obtenir une visualisation multi-dimensionnelle de données orientées sujet, intégrées, historisées et non volatiles.
On peut ainsi par exemple:
- Suivre l'évolution des ventes d'un produit ou d'une classe de produits.
- Suivre les ventes par région.
- Comparer le marché de ses clients.
- Comparer le profil des employés de l'entreprise.
L'objectif étant de retrouver et analyser l'information facilement et rapidement à travers différents outils de traitements et de restitutions pour la prise de décisions.
Architecture :
Pourquoi ne pas utiliser un SGDB:
Le SGDB et le Data WareHouse n'ont du tout le même rôle et par conséquence ont des traitements différents. Du fait qu'ils stockent les données différemment, qu'ils font l'objet de requêtes différentes et pour des raisons de performances, ils doivent être physiquemment séparés. Les traitements des SGDB sont transactionnels(OLTP*), ils permettent d'insérer, modifier et interroger des tuples rapidement et font souvent partie de l'environnement de production contrairement aux Data WareHouse qui sont concus pour l'aide à la prise de décision(OLAP*) et dont les données qui sont utilisés, sont regroupées, organisées et orientées métiers et ne sont accéssibles qu'en lecture.
Caractéristiques |
OLTP |
OLAP |
| Applications |
Production |
Aide à la décision |
| Utilisateurs |
Un département, un service, une unitée de production |
Transversal a l'entreprise |
| Données |
Normalisées, non agrégées |
Dénormalisées, agrégées |
| Requêtes |
Simples, nombreuses, régulière, prévisibles, répétitives. |
Complexes, peu nombreuses, irrégulières, non prévisibles. |
| Nb tuples invoqués par requêtes |
Dizaines |
Millions |
| Taile des données |
100 MB à 1 GB |
1 GB à 1TB
|
| Ancienneté des données |
Récentes et mises à jour |
Historisées |
- *OLTP: On-Line Transaction Processing
- *OLAP: On-Line Analytical Processing
- *Cube: Un cube est une représentation des données sous une forme multidimensionnelle

|