Back to Search
Start Over
Параллельный алгоритм кластеризации данных для многоядерных ускорителей Intel MIC
- Publication Year :
- 2019
- Publisher :
- Научно-исследовательский вычислительный центр Московского государственного университета им. М.В. Ломоносова, 2019.
-
Abstract
- Алгоритм PAM (Partitioning Around Medoids) представляет собой разделительный алгоритм кластеризации, в котором в качестве центров кластеров выбираются только кластеризуемые объекты (медоиды). Кластеризация на основе техники медоидов применяется в широком спектре приложений: сегментирование медицинских и спутниковых изображений, анализ ДНК-микрочипов и текстов и др. На сегодня имеются параллельные реализации PAM для систем GPU и FPGA, но отсутствуют таковые для многоядерных ускорителей архитектуры Intel Many Integrated Core (MIC). В настоящей статье предлагается новый параллельный алгоритм кластеризации PhiPAM для ускорителей Intel MIC. Вычисления распараллеливаются с помощью технологии OpenMP. Алгоритм предполагает использование специализированной компоновки данных в памяти и техники тайлинга, позволяющих эффективно векторизовать вычисления на системах Intel MIC. Эксперименты, проведенные на реальных наборах данных, показали хорошую масштабируемость алгоритма.<br />The PAM (Partitioning Around Medoids) is a partitioning clustering algorithm where each cluster is represented by an object from the input dataset (called a medoid). The medoid-based clustering is used in a wide range of applications: the segmentation of medical and satellite images, the analysis of DNA microarrays and texts, etc. Currently, there are parallel implementations of PAM for GPU and FPGA systems, but not for Intel Many Integrated Core (MIC) accelerators. In this paper, we propose a novel parallel PhiPAM clustering algorithm for Intel MIC systems. Computations are parallelized by the OpenMP technology. The algorithm exploits a sophisticated memory data layout and loop tiling technique, which allows one to efficiently vectorize computations with Intel MIC. Experiments performed on real data sets show a good scalability of the algorithm.<br />ВЫЧИСЛИТЕЛЬНЫЕ МЕТОДЫ И ПРОГРАММИРОВАНИЕ: НОВЫЕ ВЫЧИСЛИТЕЛЬНЫЕ ТЕХНОЛОГИИ, Выпуск 2 2019
- Subjects :
- data layout
vectorization of computations
Computer science
параллельный алгоритм
Computation
Parallel algorithm
OpenMP
Loop tiling
представление данных в памяти
Medoid
medoid
parallel algorithm
Intel Xeon Phi
Scalability
медоид
векторизация вычислений
кластеризация
Cluster analysis
Field-programmable gate array
Algorithm
Xeon Phi
clustering
Subjects
Details
- Language :
- Russian
- Database :
- OpenAIRE
- Accession number :
- edsair.doi...........95d08ed4bf8f364daf77a9c481a54d1b
- Full Text :
- https://doi.org/10.26089/nummet.v20r211