Back to Search Start Over

SMILK, linking natural language and data from the web

Authors :
Elena Cabrio
Molka Tounsi Dhouib
Fabien Gandon
Cédric Lopez
Catherine Faron-Zucker
Frédéric Segond
Exploration et exploitation de données textuelles (TEXTE)
Laboratoire d'Informatique de Robotique et de Microélectronique de Montpellier (LIRMM)
Centre National de la Recherche Scientifique (CNRS)-Université de Montpellier (UM)-Centre National de la Recherche Scientifique (CNRS)-Université de Montpellier (UM)
Laboratoire d'Informatique, Signaux, et Systèmes de Sophia Antipolis (I3S)
Université Nice Sophia Antipolis (... - 2019) (UNS)
COMUE Université Côte d'Azur (2015-2019) (COMUE UCA)-COMUE Université Côte d'Azur (2015-2019) (COMUE UCA)-Centre National de la Recherche Scientifique (CNRS)-Université Côte d'Azur (UCA)
Web-Instrumented Man-Machine Interactions, Communities and Semantics (WIMMICS)
Inria Sophia Antipolis - Méditerranée (CRISAM)
Institut National de Recherche en Informatique et en Automatique (Inria)-Institut National de Recherche en Informatique et en Automatique (Inria)-Scalable and Pervasive softwARe and Knowledge Systems (Laboratoire I3S - SPARKS)
COMUE Université Côte d'Azur (2015-2019) (COMUE UCA)-COMUE Université Côte d'Azur (2015-2019) (COMUE UCA)-Centre National de la Recherche Scientifique (CNRS)-Université Côte d'Azur (UCA)-Université Nice Sophia Antipolis (... - 2019) (UNS)
COMUE Université Côte d'Azur (2015-2019) (COMUE UCA)-COMUE Université Côte d'Azur (2015-2019) (COMUE UCA)-Centre National de la Recherche Scientifique (CNRS)-Université Côte d'Azur (UCA)-Laboratoire d'Informatique, Signaux, et Systèmes de Sophia Antipolis (I3S)
COMUE Université Côte d'Azur (2015-2019) (COMUE UCA)
Xerox Research Centre Europe [Meylan]
Xerox Company
Source :
Revue des Sciences et Technologies de l'Information-Série RIA : Revue d'Intelligence Artificielle, Revue des Sciences et Technologies de l'Information-Série RIA : Revue d'Intelligence Artificielle, Lavoisier, 2018, 32 (3), pp.287-312. ⟨10.3166/ria.32.287-312⟩
Publication Year :
2018
Publisher :
HAL CCSD, 2018.

Abstract

National audience; As part of the SMILK Joint Lab, we studied the use of Natural Language Processing to: (1) enrich knowledge bases and link data on the web, and conversely (2) use this linked data to contribute to the improvement of text analysis and the annotation of textual content, and to support knowledge extraction. The evaluation focused on brand-related information retrieval in the field of cosmetics. This article describes each step of our approach: the creation of ProVoc, an ontology to describe products and brands; the automatic population of a knowledge base mainly based on ProVoc from heterogeneous textual resources; and the evaluation of an application which that takes the form of a browser plugin providing additional knowledge to users browsing the web.; Le laboratoire commun SMILK avait pour double sujet d'étude l'utilisation du traitement automatique du langage naturel pour aider à la construction et au liage de données sur le web et, à l'inverse, l'utilisation de ces données liées du web sémantique pour aider à l'analyse des textes et venir en appui de l'extraction de connaissances et l'annotation de contenus textuels. L'évaluation de nos travaux s'est focalisée sur la recherche d'informations portant sur des marques, plus particulièrement dans le domaine de la cosmétique. Cet article décrit chaque étape de notre approche : la conception de ProVoc, une ontologie pour décrire les produits et marques ; le peuplement automatique d'une base de connaissances reposant notamment sur ProVoc à partir de ressources textuelles hétérogènes; et l'évaluation d'une application prenant la forme d'un plugin de navigateur proposant des connaissances supplémentaires aux utilisateurs naviguant sur le web.

Details

Language :
French
ISSN :
0992499X and 19585748
Database :
OpenAIRE
Journal :
Revue des Sciences et Technologies de l'Information-Série RIA : Revue d'Intelligence Artificielle, Revue des Sciences et Technologies de l'Information-Série RIA : Revue d'Intelligence Artificielle, Lavoisier, 2018, 32 (3), pp.287-312. ⟨10.3166/ria.32.287-312⟩
Accession number :
edsair.doi.dedup.....3ddd822ef6815ee062c53219fe055856
Full Text :
https://doi.org/10.3166/ria.32.287-312⟩