Back to Search Start Over

Galois Lattices for fuzzy many-valued contexts. Application to life traits study in hydrobiology

Authors :
Bertaux, Aurélie
Laboratoire des Sciences de l'Image, de l'Informatique et de la Télédétection (LSIIT)
Centre National de la Recherche Scientifique (CNRS)
Laboratoire d'Hydrologie et de Géochimie de Strasbourg (LHyGeS)
École Nationale du Génie de l'Eau et de l'Environnement de Strasbourg (ENGEES)-Université de Strasbourg (UNISTRA)-Institut national des sciences de l'Univers (INSU - CNRS)-Ecole et Observatoire des Sciences de la Terre (EOST)
Institut national des sciences de l'Univers (INSU - CNRS)-Université de Strasbourg (UNISTRA)-Centre National de la Recherche Scientifique (CNRS)-Institut national des sciences de l'Univers (INSU - CNRS)-Centre National de la Recherche Scientifique (CNRS)-Centre National de la Recherche Scientifique (CNRS)
Université de Strasbourg
Florence Le Ber(florence.leber@engees.unistra.fr)
Indices
Bertaux, Aurélie
Source :
Interface homme-machine [cs.HC]. Université de Strasbourg, 2010. Français
Publication Year :
2010
Publisher :
HAL CCSD, 2010.

Abstract

This computer information science PhD takes place in the framework of Formal Concept Analysis (FCA) or Galois lattices, which are tools based on mathematical operators called Galois connections allowing to generate concepts. A concept is composed with a set of objects sharing a set of attributes. These concepts are generated from a context which is a table of binary relations between these objects and these attributes. We are interested in complex contexts for which the complexity is based on two elements. On one hand, on many-valued context for which the attributes are divided into several modalities. On the other hand, it is based on fuzzy contexts for which the relation between objects and attributes is not binary. We define fuzzy many-valued contexts which inherit of both complexities and introduce two conversions for fuzzy many-valued data. The first conversion is a binarisation by a complete disjonctive operation allowing to use tools such as implications and to compare and combine lattices with statistical methods such as factorial analysis. The second conversion is issued from histogram scaling which we define and which converts attributes into histograms. To generate concepts from histograms, we propose new Galois connections based on a similarity measure between these histograms. These connections allow to obtain concepts where objects share attributes which are not equal but similar between the same minimum and maximum. We also propose to use thresholds to limit the number of generated concepts and decrease calculating time. We have tested and compared the performance of two algorithms : MinMaxNC and MinMaxC implementing this connection. This PhD is applied to the hydrobiological domain for which it is needed to select ecological traits allowing to caracterize ecological quality of water surfaces due to the behaviour of species in their environment. The selection of these traits is based on the search of groups of taxons sharing morphological and physiological (called biological traits) characteristics. These groups correspond to concepts in FCA and biological data can be considered as fuzzy many-valued context for which we show the efficency of our approach.<br />Cette thèse en informatique se place dans le cadre de l'Analyse de Concepts Formels (ACF) ou les treillis de Galois. Ce sont des outils basés sur des opérateurs mathématiques appelés fermetures de Galois permettant de calculer des concepts. Un concept est formé d'un ensemble d'objets partageant tous un ensemble d'attributs communs. Ces concepts sont extraits à partir d'un contexte qui est une table de relation binaire entre ces objets et ces attributs. Nous nous intéressons à des contextes complexes dont la complexité repose sur deux axes. D'une part, les contextes multi-valués dont les attributs se divisent en plusieurs modalités. D'autre part, les contextes flous dont la relation entre objets et attributs n'est pas binaire. Nous définissons les contextes multi-valués flous qui héritent de ces deux complexités et présentons deux conversions des données multi-valuées floues. La première conversion est une binarisation par une disjonction totale des attributs permettant d'une part l'exploitation d'outils comme des implications et d'autre part de comparer et combiner les treillis avec des méthodes statistiques telles que l'analyse factorielle. La seconde conversion est issue de l'échelonnage histogramme que nous définissons et qui permet de convertir les attributs en histogrammes. Afin de générer les concepts à partir des histogrammes, nous proposons une nouvelle fermeture de Galois basée sur une mesure de similarité entre ces histogrammes. Cette fermeture permet d'obtenir des concepts pour lesquels les objets possèdent des attributs non plus égaux mais similaires compris entre un minimum et un maximum communs. Nous proposons également des mesures de seuillage pour limiter le nombre de concepts générés et diminuer les temps de calculs. Enfin, deux algorithmes ont été testés pour implémenter cette fermeture : MinMaxNC et MinMaxC, dont nous comparons les performances. Cette thèse trouve son application notamment dans le domaine hydrobiologique dont une problématique est la sélection de traits écologiques de taxons permettant de caractériser l'état écologique des cours d'eau par le comportement des espèces au sein de leur environnement. La sélection de ces traits s'appuie sur la recherche de groupes de taxons possédant des caractéristiques morphologiques et physiologiques (appelés traits biologiques) communes. Ces groupes correspondent à des concepts au sens de l'ACF et les données biologiques se présentent sous la forme d'un contexte multi-valué flou pour lequel nous montrons l'efficacité de notre approche.

Details

Language :
French
Database :
OpenAIRE
Journal :
Interface homme-machine [cs.HC]. Université de Strasbourg, 2010. Français
Accession number :
edsair.dedup.wf.001..9367434412ba780979028ba459fc89ad