Pinaud, Bruno, Laboratoire Bordelais de Recherche en Informatique (LaBRI), Université de Bordeaux (UB)-Centre National de la Recherche Scientifique (CNRS)-École Nationale Supérieure d'Électronique, Informatique et Radiocommunications de Bordeaux (ENSEIRB), Université de Bordeaux (UB), Université de Bordeaux, Gilles Venturini, and Pinaud, Bruno
Recruté maître de conférences en septembre 2008, je suis membre de l’équipe BKB (Bench to Knowledge and Beyond) du Laboratoire Bordelais de Recherche en Informatique (LaBRI) et responsable du thème « Model Analysis to Knowledge ». Le nom du thème résume parfaitement la thématique générale de mes travaux qui se situent dans ce que l’on appelle dorénavant la « science des données ». Cette science, en plein essor, consiste à utiliser de façon combinée et complémentaire des outils mathématiques, statistiques, de l’informatique et de la visualisationd’informations pour permettre à un expert d’un domaine d’application d’analyser ses données complexes et hétérogènes mais pas forcément volumineuses (les données tiennent en mémoire centrale d’un ordinateur moderne). L’objectif principal est d’améliorer sa compréhension des données et de leurs relations et ainsi potentiellement extraire des nouvelles connaissances intéressantes. Dans ce contexte mes travaux se focalisent globalement sur la modélisation, construction, stockage, visualisation et analyse de divers types de réseaux construits à l’aide de données fournies, le plus souvent, par des experts de ces données. Dans ce manuscrit, je présente des collaborations avec des géographes, juristes, bioinformaticiens, historiens, et pour finir avec des experts en sciences forensiques ou criminelles.Dans mon cas, un réseau est défini informellement comme un ensemble d’éléments liés entre eux ou en interactions. Mathématiquement parlant, un réseau est modélisé par un graphe qu’il faut construire, manipuler et visualiser. Depuis que je suis au LaBRI, la majeure partie de mestravaux est consacrée à une mise en œuvre particulière du processus décrit précédemment : le développement d’une méthodologie basée sur la programmation à base de règles, aussi appelée réécriture de graphes, et de son implémentation dans une plateforme visuelle et interactivebaptisée Porgy. L’objectif est de construire un modèle d’un système complexe, d’effectuer des simulations variées et d’analyser les résultats obtenus le tout en utilisant la visualisation et en interaction permanente avec l’expert des données. J’ai aussi notamment contribué à des travaux sur la visualisation de graphes ou l’évaluation quantitative et qualitative de méthodes de visualisation.La construction et/ou la manipulation et/ou la visualisation d’un réseau sont toujours présentes dans mes travaux et mes publications portent sur tout ou partie de ce processus. Je retiens particulièrement 7 articles dans des journaux internationaux, 6 articles dans des conférences internationales, 3 chapitres de livres internationaux, 3 publications à portée nationale (dont un prix du meilleur article académique en 2015). Ces contributions ont été pour la plupart rendues possible par la coordination de deux projets ANR (jeunes chercheurs et international avec leLuxembourg) et deux co-directions de thèse (la première soutenue en décembre 2017 et l’autre débutée en avril 2016). Ces travaux possèdent, bien sûr, une part importante de développement logiciels. Les travaux sur Porgy sont liés à des collaborations nationales et internationales initiées rapidement après ma nomination MCF en 2008.Dans ce manuscrit, après une introduction qui détaille le positionnement scientifique et le contexte de l’ensemble de mes travaux et leurs contributions, je présente dans deux chapitres la plateforme Porgy et sa méthodologie de programmation à base de règles. Le premier porte surla conception et le développement de l’ensemble de la méthodologie et de l’outil Porgy pour en faire une plateforme générique, c’est-à-dire non dédiée à un type de donnée particulière. Le deuxième chapitre présente différentes applications de Porgy afin de montrer que la plateformeet sa méthodologie associée possèdent bien les propriétés annoncées comme la généricité, la souplesse (applications sur des données bioinformatique ou bien des réseaux sociaux) et couvre l’ensemble des étapes d’un processus de science des données : modélisation, simulation et analyse.Plus récemment, je participe à des projets en collaboration avec des experts de sciences humaines et sociales (géographie, histoire contemporaine, réseaux criminels, humanités numériques). Mon objectif premier reste sensiblement le même que pour les travaux sur Porgy : àpartir de données complexes et hétérogènes fournies par les experts, il s’agit de (re)construire et analyser visuellement et interactivement des réseaux pour aider l’expert dans sa compréhension des données. Je présente dans un dernier chapitre des leçons tirées de ces projets notammentla difficulté de trouver un modèle générique de réseau suffisamment souple pour s’adapter à tous les types d’application et d’interactions. En particulier, un système complexe réel ne se modélise pas seulement avec un seul réseau mais plutôt un ensemble de réseaux liés entre eux.Une réponse semble être l’utilisation d’un modèle récemment publié (2014) baptisé les réseaux multicouches. Ce modèle permet de vraiment prendre en compte l’ensemble de la complexité du système à modéliser tout en restant facilement compréhensible et manipulable par les expertsdes données. La notion de couches amène des questions nouvelles puisque celles-ci deviennent un artefact mobilisable par l’analyse et la visualisation. Ces techniques d’analyse et de visualisation doivent donc évoluer pour être adaptées aux réseaux multicouches. Ce manuscrit termine ainsi par différentes perspectives de recherche autour des réseaux multicouches et de la confiance, si difficile à obtenir, des experts dans la visualisation.