Une approche automatisée basée sur des contraintes d'intégrité définies en UML et OCL pour la vérification de la cohérence logique dans les systèmes SOLAP. Applications dans le domaine agri-environnemental - INRAE - Institut national de recherche pour l’agriculture, l’alimentation et l’environnement Accéder directement au contenu
Thèse Année : 2012

(trad auto)An automated approach based on integrity constraints defined in UML and OCL for checking logical consistency in SOLAP systems. Applications in the agri-environmental field

Une approche automatisée basée sur des contraintes d'intégrité définies en UML et OCL pour la vérification de la cohérence logique dans les systèmes SOLAP. Applications dans le domaine agri-environnemental

Résumé

(trad auto)Spatial Data Warehouse and OLAP systems (EDS and SOLAP) are decision support technologies that enable the multidimensional analysis of large volumes of spatial data. In these systems, the quality of analysis depends on three factors: the quality of the data stored, the quality of aggregations and the quality of data mining. The quality of the stored data depends on criteria such as accuracy, completeness and logical consistency. The quality of aggregation depends on structural problems (e.g. loose hierarchies that can lead to double counting of measurements) and semantic problems (e.g. aggregating temperature values by the Sum function may not make sense considering a given application). The exploration quality is mainly affected by inconsistent user requests (e.g. what were the temperature values in the USSR in 2010?). These queries can lead to misinterpretations of the results. This thesis addresses the problems of logical inconsistency that can affect the qualities of data, aggregation and exploration. Logical inconsistency is usually defined as the presence of contradictions in the data. It is typically controlled by means of Integrity Constraints (IC). In this thesis we first extend the notion of CI (in the context of SOLAP systems) to take into account inconsistencies related to user aggregations and requests. To overcome the limitations of existing approaches to defining SOLAP CIs, we propose a Framework based on the standard UML and OCL languages. This Framework allows the conceptual and independent specification of SOLAP IC platforms and their automated implementation. It is divided into three parts: (1) A classification of SOLAP CIs. (2) A UML profile implemented in the MagicDraw LGA, allowing the conceptual representation of SOLAP system models and their CIs. (3) An automatic implementation based on the OCL2SQL and UML2MDX Spatial code generators that allows to translate the design specifications into code at the EDS and SOLAP server layers. Finally, the contributions of this thesis have been applied in the framework of national projects for the development of (S)OLAP applications for agriculture and the environment.
Les systèmes d'Entrepôts de Données et OLAP spatiaux (EDS et SOLAP) sont des technologies d'aide à la décision permettant l'analyse multidimensionnelle de gros volumes de données spatiales. Dans ces systèmes, la qualité de l'analyse dépend de trois facteurs : la qualité des données entreposées, la qualité des agrégations et la qualité de l’exploration des données. La qualité des données entreposées dépend de critères comme la précision, l'exhaustivité et la cohérence logique. La qualité d'agrégation dépend de problèmes structurels (e.g. les hiérarchies non strictes qui peuvent engendrer le comptage en double des mesures) et de problèmes sémantiques (e.g. agréger les valeurs de température par la fonction Sum peut ne pas avoir de sens considérant une application donnée). La qualité d'exploration est essentiellement affectée par des requêtes utilisateur inconsistantes (e.g. quelles ont été les valeurs de température en URSS en 2010 ?). Ces requêtes peuvent engendrer des interprétations erronées des résultats. Cette thèse s'attaque aux problèmes d'incohérence logique qui peuvent affecter les qualités de données, d'agrégation et d'exploration. L'incohérence logique est définie habituellement comme la présence de contradictions dans les données. Elle est typiquement contrôlée au moyen de Contraintes d'Intégrité (CI). Dans cette thèse nous étendons d'abord la notion de CI (dans le contexte des systèmes SOLAP) afin de prendre en compte les incohérences relatives aux agrégations et requêtes utilisateur. Pour pallier les limitations des approches existantes concernant la définition des CI SOLAP, nous proposons un Framework basé sur les langages standards UML et OCL. Ce Framework permet la spécification conceptuelle et indépendante des plates-formes des CI SOLAP et leur implémentation automatisée. Il comporte trois parties : (1) Une classification des CI SOLAP. (2) Un profil UML implémenté dans l'AGL MagicDraw, permettant la représentation conceptuelle des modèles des systèmes SOLAP et de leurs CI. (3) Une implémentation automatique qui est basée sur les générateurs de code Spatial OCL2SQL et UML2MDX qui permet de traduire les spécifications conceptuelles en code au niveau des couches EDS et serveur SOLAP. Enfin, les contributions de cette thèse ont été appliquées dans le cadre de projets nationaux de développement d'applications (S)OLAP pour l'agriculture et l'environnement.

Mots clés

Fichier non déposé

Dates et versions

tel-02598333 , version 1 (15-05-2020)

Identifiants

Citer

K. Boulil. Une approche automatisée basée sur des contraintes d'intégrité définies en UML et OCL pour la vérification de la cohérence logique dans les systèmes SOLAP. Applications dans le domaine agri-environnemental. Sciences de l'environnement. Doctorat Informatique, Université Blaise Pascal, Clermont-Ferrand II, 2012. Français. ⟨NNT : ⟩. ⟨tel-02598333⟩
5 Consultations
0 Téléchargements

Partager

Gmail Facebook X LinkedIn More