Classification de données paleo-climatique

Porteurs de projet : G.GASSIER, D.BARBONI

Ce projet a pour objectif de réaliser une synthèse  des données paléo-florale entre -7 et -1 millions d’années en Afrique et, notamment d’en comprendre les variations. A termes, cette étude vise à établir un proxy du changement climatique.

Grâce à l’agréation de nombreuses données (carottage, prélèvement), nous sommes en mesure de construire des chroniques partielles de l’évolution du taux de delta C13 ou du type de pollen (…) qui est significatif du type de couverture végétales (savane, forêt équatoriale,…)

Cependant, comme les données disponibles sont très irrégulières, une interprétation direct semble difficile. Voici un exemple de données de delta C13 de la vallée de l’Awash.

 

Figure montrant la variation du taux de Delta C13 en fonction du temps dans la vallée de l’AWASH.

fig.1

En outre, les méthodes d’interpolations à partir des données brutes afin de “boucher les trous” amène à des résultats conditionnés par le type même d’interpolation utilisé (linéaire, Spline, polynomiales). En effet, celles-ci introduisent des à priori ( smooth, …..) sur les variations alors même que l’on cherche à les comprendre.

Par conséquent, nous proposons d’utiliser des méthodes de traitement du type “classification automatique (Kmeans)” sur les données, permettant de créer un certains nombres de groupes de données dont les variations du taux de delta C13 (resp. Type de pollen) et de l’âge sont minimales tout en conservant une variation maximale entre les groupes. En outre,  il a été possibles d’adapte ce traitement afin que l’âge entre groupes ne se chevauchent pas. Les centroïdes (centre d’inertie) sont désormais considérés comme plus représentatif du groupe et c’est sur ceci que seront réalisé les interpolations.

 

Avec 10 groupes, les centroïdes (centre des classes) montrent clairement une tendance à la baisse du taux de delta C13 à 3.5 millions d’année.

Cette tendance se retrouve peut importe le nombre de groupes choisi pour réaliser la classification. Voici une courbe construite par la régression linéaire entre tout les centroïdes possibles entre 2 et 10 groupes. On  représente aussi l’enveloppe d’erreur prenant en compte la variance des groupes.

Cette étude fait partie d’un ANR dont voici le lien.