Back to Search Start Over

Towards Understanding Web Applications: Automated Abstraction Inference and its Applications

Authors :
Brisset, Sacha
Self-adaptation for distributed services and large software systems (SPIRALS)
Inria Lille - Nord Europe
Institut National de Recherche en Informatique et en Automatique (Inria)-Institut National de Recherche en Informatique et en Automatique (Inria)-Centre de Recherche en Informatique, Signal et Automatique de Lille - UMR 9189 (CRIStAL)
Centrale Lille-Université de Lille-Centre National de la Recherche Scientifique (CNRS)-Centrale Lille-Université de Lille-Centre National de la Recherche Scientifique (CNRS)
Institut National de Recherche en Informatique et en Automatique (Inria)
Université Lille Nord (France)
Université de lille
inria lille
Lionel Seinturier
Renaud Pawlak
Centre de Recherche en Informatique, Signal et Automatique de Lille - UMR 9189 (CRIStAL)
Centrale Lille-Université de Lille-Centre National de la Recherche Scientifique (CNRS)
Université de Lille
Source :
Computational Engineering, Finance, and Science [cs.CE]. Université de lille; inria lille, 2022. English. ⟨NNT : ⟩, Web. Université de Lille, 2022. English. ⟨NNT : 2022ULILB036⟩
Publication Year :
2022
Publisher :
HAL CCSD, 2022.

Abstract

Web applications are at every corner of modern society.The largest web applications can serve millions of people.These applications are expected to be strongly reliable and stable yet capable to evolve to adapt to its users.At such a scale, these expectations can only be met through huge resources and time.For this reason, it is critical to further our ability to understand the structure of web applications to ease their maintenance and evolution.In this thesis, we explore web application structure through a variety of lenses: web testing, data extraction and web analytics.Our study shows that many web-related research, regardless of the research domain, suffer greatly from the lack of a generic fully unsupervised web application abstraction inference solution. We attempt to develop such a solution iteratively leading to three main contributions:SFTM. Similarity-based Tree Matching, an algorithm allowing to match two web pages. Compared to traditional, generic Tree Matching algorithms, SFTM produces better matchings for computation times several orders of magnitude smaller.ERRATUM. An approach allowing to repair locators on web applications. ERRATUM strongly improves the quality of repairs for little to no overhead. We integrated ERRATUM to a widely used open-source testing framework.APPSTRACT. An approach to automatically generate an abstraction of a web application. APPSTRACT combines intra-page abstraction and inter-page abstraction using SFTM to generate robust and semantically-rich application-wide locator identifiers for each element of a webpage.We believe our work opens up many new possibilities in a variety of research domains, in particular: the computation speed of SFTM enables approaches that were previously unpractical with generic tree matching and the approach we describe in APPSTRACT could pioneer new web analytics or web testing generation solutions based on web application abstraction.; Les applications web sont omniprésentes au sein de la société moderne.Les plus grandes applications web peuvent servir des millions de personnes.On attend de ces applications qu'elles soient fiables et stables tout en étant capables d'évoluer pour s'adapter à ses utilisateurs.À une telle échelle, ces attentes ne peuvent être satisfaites qu'avec d'énormes ressources et du temps.Pour cette raison, il est essentiel d'approfondir notre capacité à comprendre la structure des applications web pour faciliter leur maintenance et leur évolution.Dans cette thèse, nous explorons la structure des applications web sous plusieurs angles : les tests web, l'extraction de données et l'analyse de comportement utilisateur sur le web.Notre étude montre que de nombreuses recherches liées au web, quel que soit le domaine de recherche, souffrent grandement de l'absence d'une solution générique d'inférence d'abstraction d'applications web entièrement non supervisée. Nous tentons de développer une telle solution de manière itérative aboutissant à trois contributions principales :SFTM. Tree Matching basé sur la similarité, un algorithme permettant de faire correspondre deux pages Web. Comparé aux algorithmes de matching d'arbres génériques traditionnels, SFTM produit de meilleures matching pour des temps de calcul de plusieurs ordres de grandeur plus petits.ERRATUM. Une approche permettant de réparer les localisateurs sur les applications web. ERRATUM améliore fortement la qualité des réparations pour peu ou pas de frais généraux. Nous avons intégré ERRATUM à un cadre de test open source largement utilisé.APPSTRACT. Une approche pour générer automatiquement une abstraction d'une application Web. APPSTRACT combine l'abstraction intra-page et l'abstraction inter-page à l'aide de SFTM pour générer des identifiants de localisation robustes et sémantiquement riches à l'échelle de l'application pour chaque élément d'une page Web.Nous pensons que notre travail ouvre de nombreuses nouvelles possibilités dans une variété de domaines de recherche, en particulier : la vitesse de calcul de SFTM permet des approches qui n'étaient auparavant pas possibles avec le matching d'arbres génériques et l'approche que nous décrivons dans APPSTRACT pourrait ouvrir la voie à de nouvelles solutions pour l'analyse de comportement utilisateur sur le web ou de génération de tests.

Details

Language :
English
Database :
OpenAIRE
Journal :
Computational Engineering, Finance, and Science [cs.CE]. Université de lille; inria lille, 2022. English. ⟨NNT : ⟩, Web. Université de Lille, 2022. English. ⟨NNT : 2022ULILB036⟩
Accession number :
edsair.dedup.wf.001..2d609947da0248db0d09ea670d2c5b93