Intégration des tableaux multidimensionnels en pig pour l'entreposage de données sur les nuages - INRAE - Institut national de recherche pour l’agriculture, l’alimentation et l’environnement Accéder directement au contenu
Communication Dans Un Congrès Année : 2010

Intégration des tableaux multidimensionnels en pig pour l'entreposage de données sur les nuages

Résumé

Data warehouses and OLAP systems are business intelligence technologies. They allow decision-makers to analyze on the fly huge volume of data represented according to the multidimensional model. Cloud computing on the impulse of ICT majors like Google, Microsoft and Amazon, has recently focused the attention. OLAP querying and data warehousing in such a context consists in a major issue. Indeed, problems to be tackled are basic ones for large scale distributed OLAP systems (large amount of data querying, semantic and structural heterogeneity) from a new point of view, considering specificities from these architectures (pay-as-you-go rule, elasticity, and user-friendliness). In this paper we address the pay-as you-go rules for warehousing data storage. We propose to use the multidimensional arrays storage techniques for clouds. First experiments validate our proposal. Then we list research perspectives.
Les entrepôts de données et les systèmes OLAP correspondent à des technologies d'aide à la décision. Ils permettent d'analyser à la volée de gros volumes de données représentés en fonction d'un modèle multidimensionnel. L'informatique dans les nuages, sous l'impulsion des grandes compagnies telles que Google, Microsoft ou encore Amazon, a récemment suscité une attention particulière. Considérer l'interrogation OLAP et les entrepôts de données au sein de telles infrastructures devient alors un enjeu majeur. Les problèmes devant être considérés sont ceux classiques des systèmes largement distribués (interrogation de gros volumes de données, hétérogénéité sémantique et structurelle ou encore variabilité), mais d'un nouveau point de vue devant considérer les spécificités de ces architectures (facturation à l'utilisation, élasticité et facilité d'utilisation). Dans ce papier nous abordons dans un premier temps les règles de facturation à l'utilisation pour le stockage des entrepôts de données. Nous proposons d'utiliser des techniques de stockage pour nuages à base de tableaux multidimensionnels. De premières expérimentations montrent l'intérêt de notre proposition. Ensuite, nous listons des perspectives de recherche.

Mots clés

Fichier non déposé

Dates et versions

hal-02593571 , version 1 (15-05-2020)

Identifiants

Citer

L. d'Orazio, S. Bimonte. Intégration des tableaux multidimensionnels en pig pour l'entreposage de données sur les nuages. Journées francophones sur les entrepôts de données et l'analyse en ligne, Jun 2010, Djerba, Tunisie. pp.21-34. ⟨hal-02593571⟩
13 Consultations
0 Téléchargements

Partager

Gmail Facebook X LinkedIn More