Data-set cleansing practices and hydrological regionalization: is there any valuable information among outliers? - INRAE - Institut national de recherche pour l’agriculture, l’alimentation et l’environnement Accéder directement au contenu
Article Dans Une Revue Hydrological Sciences Journal Année : 2010

Data-set cleansing practices and hydrological regionalization: is there any valuable information among outliers?

Pratiques de nettoyage de jeu de données et régionalisation : y a-t-il de l'information valuable parmi les horsains ?

Résumé

In hydrological regionalization studies, where one attempts to transfer information from gauged (donor) stations to ungauged (target) ones, the problem of data quality and reliability is often raised. Should all the available data be used? Or should some donor stations be considered unreliable for some reason and therefore discarded? In this article, we address these questions by proposing a new method to detect potentially undesirable stations: this method to identify outliers is based on the detection of catchments which do not fit in their neighbourhood. We apply this approach to a case of simple regionalization involving reference flows and compare it with the traditional outlier detection method. As expected, different outlier definitions lead to considerably different results, and the proposed method appears to perform noticeably better than the traditional one.
En régionalisation hydrologique, où l'on essaie de transférer de l'information de stations jaugées (donneuses) à des stations non jaugées (cibles), la question de la qualité et de la fiabilité des données est souvent posée. Faut-il utiliser toutes les stations donneuses disponibles? Ou faut-il au contraire écarter certaines stations que l'on considérerait comme douteuse pour une raison ou une autre? Dans cet article, nous abordons cette question en proposant une nouvelle approche pour détecter des stations potentiellement indésirables: cette méthode d'identification des horsains est fondée sur la détection des bassins versants incohérents avec leur voisinage. Cette approche est appliquée dans un cas de régionalisation simple (débits de référence), et nous la comparons avec l'approche de détection des horsains traditionnelle. Comme nous l'attendions, les différentes définitions de horsains donnent des résultats variés; la méthode proposée ici apparaît significativement meilleure.

Mots clés

Fichier non déposé

Dates et versions

hal-02594583 , version 1 (15-05-2020)

Identifiants

Citer

Gianluca Boldetti, Marine Riffard, Vazken Andréassian, Ludovic Oudin. Data-set cleansing practices and hydrological regionalization: is there any valuable information among outliers?. Hydrological Sciences Journal, 2010, 55 (6), pp.941-951. ⟨10.1080/02626667.2010.505171⟩. ⟨hal-02594583⟩
20 Consultations
0 Téléchargements

Altmetric

Partager

Gmail Facebook X LinkedIn More