Грант РФФИ No. 17-07-00463-а  (2017–2019 гг.)
Разработка высокомасштабируемых методов и алгоритмов интеллектуального анализа распределенных данных
на высокопроизводительных компьютерных системах с кластерной архитектурой

 
Аннотация
 
Участники
 
Публикации
 
Апробация
 
Отчеты
 
Диссертации

Участники проекта

Руководитель проекта: Цымблер Михаил Леонидович (mzym@susu.ru)

Основные исполнители проекта:

Аннотация проекта

В настоящее время стандартной платформой для аналитической обработки сверхбольших распределенных хранилищ данных являются высокопроизводительные компьютерные системы с кластерной архитектурой. Одной из важных современных тенденций развития аппаратного обеспечения является широкое распространение многоядерных ускорителей GPU и Intel Xeon Phi, устанавливаемых в том числе на суперкомпьютерные кластеры, входящие в список TOP500. Одной из важных особенностей данных ускорителей является возможность векторизации вычислений – выполнение нескольких скалярных операций при помощи одной векторной инструкции за время, близкое к выполнению скалярной операции. Проект направлен на разработку новых методов и алгоритмов интеллектуального анализа распределенных данных на высокопроизводительных вычислительных кластерах с узлами на базе многоядерных ускорителей, обеспечивающих эффективное использование векторизации вычислений и сверхвысокую масштабируемость обработки данных.

Целью проекта является разработка методов и алгоритмов, позволяющих эффективно использовать высокопроизводительные кластеры с многоядерными ускорителями для интеллектуального анализа распределенных данных. В рамках проекта предполагается рассмотреть задачи интеллектуального анализа временных рядов и поиска шаблонов в распределенных хранилищах данных. Для достижения цели необходимо решить следующие основные задачи:

  1.  разработать новые параллельные алгоритмы и методы интеллектуального анализа распределенных данных, обеспечивающие сверхвысокую масштабируемость обработки данных на вычислительных кластерах с узлами на базе многоядерных ускорителей; при этом особое внимание предполагается уделить использованию векторизации вычислений и выравнивания данных;

  2. разработать подход к интеграции созданных методов и алгоритмов в параллельную СУБД;

  3. выполнить вычислительные эксперименты, исследующие эффективность разработанных методов и алгоритмов на реальных и синтетических данных.

Публикации по проекту

Основные результаты, полученные в ходе выполнения данного проекта, опубликованы в следующих работах:

 2017 г.

  1. Zymbler M. Accelerating Dynamic Itemset Counting on Intel Many-core Systems // Proceedings of the 40th International Convention on Information and Communication Technology, Electronics and Microelectronics, MIPRO'2017, Opatija, Croatia, May 22–26, 2017. IEEE, 2017. P. 1575–1580. [PDF] [DOI: 10.23919/MIPRO.2017.7973631] [Scopus]

  2. Rechkalov T., Zymbler M. An Approach to Data Mining Inside PostgreSQL Based on Parallel Implementation of UDFs // Selected Papers of the XIX International Conference on Data Analytics and Management in Data Intensive Domains (DAMDID/RCDL 2017), Moscow, Russia, October 9–13, 2017. CEUR Workshop Proceedings. 2017. Vol. 2022. P. 114–121. [PDF]

  3.  Rechkalov T., Zymbler M. An Approach to Data Mining Inside PostgreSQL Based on Parallel Implementation of UDFs // Аналитика и управление данными в областях с интенсивным использованием данных: Сборник научных трудов XIX Международной конференции DAMDID / RCDL'2017 (10–13 октября 2017 г., Москва, МГУ, Россия). С. 147–154. [PDF]

Апробация проекта

Основные результаты, полученные в ходе выполнения данного проекта, докладывались на следующих научных конференциях, семинарах и совещаниях:

 2017 г.

  1. Международная научная конференция DAMDID/RCDL’2017, Data Analytics and Management in Data Intensive Domains (Moscow, Russia, October 10–13, 2017), М.Л. Цымблер.
    An Approach to Data Mining Inside PostgreSQL Based on Parallel Implementation of UDFs. [PDF]
  2. Международная научная конференция MIPRO 2017 - 40th International Convention (Opatija, Croatia, May 22–26, 2017), М.Л. Цымблер.
    Accelerating Dynamic Itemset Counting on Intel Many-core Systems. [PDF]

Научные отчеты по проекту

Текст

 
Изменено: 26.12.2017

Copyright © Кафедра системного программирования ЮУрГУ

Дизайн М.Л. Цымблер