Back to Search Start Over

DPiSAX: Massively Distributed Partitioned iSAX

Authors :
Florent Masseglia
Reza Akbarinia
Djamel Edine Yagoubi
Themis Palpanas
Scientific Data Management (ZENITH)
Laboratoire d'Informatique de Robotique et de Microélectronique de Montpellier (LIRMM)
Université de Montpellier (UM)-Centre National de la Recherche Scientifique (CNRS)-Université de Montpellier (UM)-Centre National de la Recherche Scientifique (CNRS)-Inria Sophia Antipolis - Méditerranée (CRISAM)
Institut National de Recherche en Informatique et en Automatique (Inria)-Institut National de Recherche en Informatique et en Automatique (Inria)
Institut de Biologie Computationnelle (IBC)
Institut National de la Recherche Agronomique (INRA)-Institut National de Recherche en Informatique et en Automatique (Inria)-Université de Montpellier (UM)-Centre National de la Recherche Scientifique (CNRS)
Université Paris Descartes - Paris 5 (UPD5)
Université de Montpellier (UM)-Institut National de la Recherche Agronomique (INRA)-Institut National de Recherche en Informatique et en Automatique (Inria)-Centre National de la Recherche Scientifique (CNRS)
Centre National de la Recherche Scientifique (CNRS)-Université de Montpellier (UM)-Centre National de la Recherche Scientifique (CNRS)-Université de Montpellier (UM)-Inria Sophia Antipolis - Méditerranée (CRISAM)
Scientific Data Management ( ZENITH )
Laboratoire d'Informatique de Robotique et de Microélectronique de Montpellier ( LIRMM )
Université de Montpellier ( UM ) -Centre National de la Recherche Scientifique ( CNRS ) -Université de Montpellier ( UM ) -Centre National de la Recherche Scientifique ( CNRS ) -Inria Sophia Antipolis - Méditerranée ( CRISAM )
Institut National de Recherche en Informatique et en Automatique ( Inria ) -Institut National de Recherche en Informatique et en Automatique ( Inria )
Institut de Biologie Computationnelle ( IBC )
Centre de Coopération Internationale en Recherche Agronomique pour le Développement ( CIRAD ) -Institut National de la Recherche Agronomique ( INRA ) -Institut National de Recherche en Informatique et en Automatique ( Inria ) -Université de Montpellier ( UM ) -Centre National de la Recherche Scientifique ( CNRS )
Université Paris Descartes - Paris 5 ( UPD5 )
Source :
International Conference on Data Mining, ICDM: International Conference on Data Mining, ICDM: International Conference on Data Mining, Nov 2017, New Orleans, United States. pp.1135-1140, ⟨10.1109/ICDM.2017.151⟩, 2017 IEEE International Conference on Data Mining (ICDM), ICDM 2017: IEEE International Conference on Data Mining, ICDM 2017: IEEE International Conference on Data Mining, Nov 2017, New Orleans, United States. pp.1-6, 2017, 〈http://www.ucs.louisiana.edu/~sxk6389/index.html〉, ICDM
Publication Year :
2017
Publisher :
HAL CCSD, 2017.

Abstract

International audience; Indexing is crucial for many data mining tasks that rely on efficient and effective similarity query processing. Consequently, indexing large volumes of time series, along with high performance similarity query processing, have became topics of high interest. For many applications across diverse domains though, the amount of data to be processed might be intractable for a single machine, making existing centralized indexing solutions inefficient. We propose a parallel indexing solution that gracefully scales to billions of time series, and a parallel query processing strategy that, given a batch of queries, efficiently exploits the index. Our experiments, on both synthetic and real world data, illustrate that our index creation algorithm works on 1 billion time series in less than 2 hours , while the state of the art centralized algorithms need more than 5 days. Also, our distributed querying algorithm is able to efficiently process millions of queries over collections of billions of time series, thanks to an effective load balancing mechanism.

Details

Language :
English
ISBN :
978-1-5386-3835-4
ISBNs :
9781538638354
Database :
OpenAIRE
Journal :
International Conference on Data Mining, ICDM: International Conference on Data Mining, ICDM: International Conference on Data Mining, Nov 2017, New Orleans, United States. pp.1135-1140, ⟨10.1109/ICDM.2017.151⟩, 2017 IEEE International Conference on Data Mining (ICDM), ICDM 2017: IEEE International Conference on Data Mining, ICDM 2017: IEEE International Conference on Data Mining, Nov 2017, New Orleans, United States. pp.1-6, 2017, 〈http://www.ucs.louisiana.edu/~sxk6389/index.html〉, ICDM
Accession number :
edsair.doi.dedup.....b9e6c8a503bdafb28c0fcfd868a25334