Un dépot de données est en cours de publication : nuts-STeauRY dataset: hydrochemical and catchment characteristics dataset for large sample studies of Carbon, Nitrogen, Phosphorus and Silicon in French watercourses
Brève présentation des données :
-
- Données sur le carbone et les nutriments pour 5470 bassins versants de France continentale
- Débits modélisés pour 5128 bassins versants sur 5470
- Géopackages avec délimitation des bassins versants et débouchés
- MNE conditionné pour délimiter des bassins versants supplémentaires
- Données sur l’utilisation des sols et le climat pour 5470 bassins versants en France continentale
Citation de ce travail
Un document de travail est en cours de soumission avec des détails sur les méthodes et les résultats. Une fois publié, il sera la source préférentielle à citer. Le document sera lié à la nouvelle version du jeu de données qui sera mise à jour sur doi.org/10.5281/zenodo.10830852.
Motivations
Les données ont été collectées et conservées pour le projet nuts-STeauRY (http://nuts-steaury.cnrs.fr), qui a déployé une chaîne de modélisation générique nationale de la terre à la mer.
Les données ont été principalement utilisées (voir les travaux connexes) :
-
- pour calibrer les concentrations de carbone organique dissous et de silice dissoute dans les eaux d’amont
- Pour valider spatialement et temporellement la chaîne de modélisation (DOC, NO3-, NH4+, TP, SRP, DSi)
Les grands échantillons de données hydrochimiques ont de nombreuses autres utilisations : les calculs de tendances élucident les mécanismes de transfert, l’apprentissage automatique, les études rétrospectives, etc.
L’objectif ici est de fournir un grand échantillon de données prétraitées sur les concentrations de carbone et de nutriments ainsi que sur les rejets modélisés, les caractéristiques des bassins versants et les délimitations pour la France continentale. Cet ensemble de données vise à faciliter les études sur de grands échantillons en France et/ou en Europe. Bien qu’une partie des données rassemblées ici soit disponible via des sources publiques, les délimitations des bassins versants, leurs caractéristiques et l’hydrologie modélisée n’étaient pas encore accessibles au public. En outre, une unification des unités et la détection et l’élimination des valeurs aberrantes ont été effectuées sur les données relatives au carbone et aux nutriments.
Sources et traitement des données
Les points d’échantillonnage ont été saisis dans la base de données CCM v2.1 (http://data.europa.eu/89h/fe1878e8-7541-4c66-8453-afdae7469221) (Vogt et al., 2007) et les bassins versants ont été délimités à l’aide d’un modèle numérique d’élévation (MNE) d’une résolution de 100 m, conditionné par le réseau hydrographique et les délimitations des bassins versants élémentaires de la base de données CCM v2.1. Plus de 6 000 bassins versants ont été délimités et triés manuellement pour vérifier la cohérence : 5 470 ont été retenus.
Les données sur les nutriments ont été collectées principalement via le portail Naiades (https://naiades.eaufrance.fr/), une base de données rassemblant des données sur la qualité de l’eau produites par différents acteurs du secteur de l’eau en France. Les données sur les nutriments ont également été collectées directement auprès des agences régionales de l’eau(https://www.eau-seine-normandie.fr/, https://eau-grandsudouest.fr/, https://www.eaurmc.fr/, https://www.eau-artois-picardie.fr/, https://www.eau-rhin-meuse.fr/ et https://agence.eau-loire-bretagne.fr/home.html), et prétraitées à l’aide d’un système de gestion de base de données reposant sur PostgreSQL avec l’extension PostGIS (Thieu & Silvestre, 2015). Une stratégie en trois étapes a été utilisée pour conserver les données brutes sur le carbone et les nutriments : 1. Détection des changements de la ligne de base et correction si possible (ou suppression des données) 3. Suppression des valeurs aberrantes à l’aide d’une approche basée sur le quantile par élément et série temporelle.
Les séries temporelles hydrologiques sont des interpolations par transfert d’hydrogramme (de Lavenne et al., 2023) de 1664 séries temporelles de débit réalisées avec le modèle GR4J (Pelletier & Andréassian, 2020 ; Pelletier 2021).
Les données climatologiques ont été extraites de la reconstruction quotidienne à 5 arcmin pour les températures et à 1 arcmin pour les précipitations sur l’Europe (Thiemig et al., 2022). Les moyennes par bassin versant des températures et précipitations journalières min&max ont été calculées pour chaque bassin versant pour la période 1990-2019.