Грант РНФ No. 23-21-00465 (2023–2024 гг.)
Методы, модели и алгоритмы интеллектуального анализа временных рядов на основе интеграции параллельных вычислений и нейросетевых технологий

 
Аннотация
 
Участники
 
Публикации
 
Апробация
 
Отчеты
 
Диссертации

Участники проекта

Руководитель проекта: Цымблер Михаил Леонидович (mzym@susu.ru)

Основные исполнители проекта:

Аннотация проекта

Целью проекта являются разработка и исследование новых моделей, методов и алгоритмов, обеспечивающих эффективный интеллектуальный анализ данных временных рядов в режиме реального времени на основе совместного применения нейросетевых и параллельных вычислительных технологий. Актуальность решения указанной научной проблемы обусловлена необходимостью теоретических методов и практических разработок, обеспечивающих эффективный интеллектуальный анализ данных временных рядов, которые в настоящее время возникают в широком спектре предметных областей: предиктивное техобслуживание оборудования в приложениях цифровой индустрии, интеллектуальное управление зданиями в приложениях Интернета вещей, мониторинг состояния человека и упреждающая диагностика заболеваний в приложениях персональной медицины и др. В настоящее время технологии нейронных сетей оказывают огромное влияние на сферу информационных технологий и применяются для решения широкого спектра задач, в т.ч. в приложениях, связанных с анализом и прогнозом временных рядов в режиме реального времени. Нейросети потенциально способны обеспечить высокое качество анализа и прогноза временных рядов и приемлемую для реального времени скорость работы. Однако для обучения нейросетей необходим большой объем предварительно очищенных и размеченных данных. В то же время очистка и разметка данных, выполняемые в ручном режиме экспертом в данной предметной области, порождает существенные накладные расходы. Научная новизна предлагаемого исследования заключается в следующем. Решение задач анализа и прогнозирования временных рядов в режиме реального времени выполняется с помощью нейросетевых моделей, для которых разрабатываются параллельные алгоритмы интеллектуального анализа временных рядов для современных многоядерных процессоров и графических ускорителей. Указанные алгоритмы применимы к временным рядам из любой предметной области без необходимости использования знаний и/или обучающих данных из этой области. Данные параллельные алгоритмы для массово распространенных в настоящее время указанных платформ позволят выполнять разметку данных обучающей выборки для нейросети в автоматизированном режиме и существенно сократить затраты на разметку данных (по сравнению с разметкой, выполняемую экспертом вручную). Кроме того, указанные выше нейросетевые модели и параллельные алгоритмы интегрируются в СУБД с открытым кодом. В настоящее время СУБД являются стандартным средством реализации хранилищ данных, которые обеспечивают безопасность, целостность данных, язык запросов и манипулирования данными и др. Однако СУБД штатно не обеспечивают интеллектуальный анализ хранимых данных. Внедрение указанных механизмов в СУБД позволит инкапсулировать стадии сбора и анализа данных в рамках одной среды и избежать существенных накладных расходов по экспорту данных во внешнюю аналитическую систему и импорту результатов анализа в хранилище данных.

Публикации по проекту

Основные результаты, полученные в ходе выполнения данного проекта, опубликованы в следующих работах:

 2023 г.

  1. Zymbler M., Kraeva Y. High-Performance Time Series Anomaly Discovery on Graphics Processors // Mathematics. 2023. Vol. 11, No. 14. Article 3193. PDF DOI: 10.3390/math11143193 WOS:001039018700001 Scopus
  2. Kraeva Y., Zymbler M. A Parallel Discord Discovery Algorithm for a Graphics Processor // Pattern Recognition and Image Analysis. 2023. Vol. 33, no. 2. P. 101–112. PDF DOI: 10.1134/S1054661823020062 WOS:001022883000004 Scopus
  3. Краева Я.А. Обнаружение аномалий временного ряда на основе технологий интеллектуального анализа данных и нейронных сетей // Вестник ЮУрГУ. Серия: Вычислительная математика и информатика. 2023. Т. 12, № 3. С. 50–71. PDF DOI: 10.14529/cmse230304
  4. Цымблер М.Л., Юртин А.А. Восстановление пропущенных значений временного ряда на основе совместного применения аналитических алгоритмов и нейронных сетей // Вычислительные методы и программирование. 2023. Т. 24, № 3. С. 243–259. PDF DOI: 10.26089/NumMet.v24r318 РИНЦ
  5. Краева Я.А. Поиск аномалий в сенсорных данных цифровой индустрии с помощью параллельных вычислений // Вестник ЮУрГУ. Серия: Вычислительная математика и информатика. 2023. Т. 12, № 2. С. 47–61. PDF DOI: 10.14529/cmse230202 РИНЦ
  6. Краева Я.А., Цымблер М.Л. Поиск аномалий в больших временных рядах на кластере с GPU узлами // Вычислительные методы и программирование. 2023. Т. 24, № 3. С. 291–304. PDF DOI: 10.26089/NumMet.v24r321 РИНЦ
  7. Краева Я.А., Цымблер М.Л. Поиск аномалий в больших временных рядах на кластере с GPU узлами // Суперкомпьютерные дни в России: Труды международной конференции (25–26 сентября 2023 г., Москва). М.: МАКС Пресс, 2023. С. 149–160. PDF DOI: 10.29003/m3478.978-5-317-07070-0

Апробация проекта

Основные результаты, полученные в ходе выполнения данного проекта, докладывались на следующих научных конференциях, семинарах и совещаниях:

 2023 г.

  1. Интеллектуальный анализ временных рядов в задачах цифровой индустрии. ЦИСП'2023: Цифровая индустрия: состояние и перспективы развития (21–23 ноября 2023 г., Челябинск). М.Л. Цымблер (пленарный доклад). PDF
  2. Discord discovery in time series. DAMDID/RCDL’2023: XXV International Conference on Data Analytics and Management in Data Intensive Domains (24–27 October 2023, Moscow, Russia) М.Л. Цымблер (пленарный доклад). PDF
  3. High-performance subsequence anomaly discovery in long time series. Software/Hardware Codesign and Performance Optimization Summit 2023 (12–14 October 2023, Nizhny Novgorod, Russia) М.Л. Цымблер (пленарный доклад). PDF
  4. Поиск аномалий в больших временных рядах на кластере с GPU узлами. Международная научная конференция «Суперкомпьютерные дни в России» (25–26 сентября 2023 г., Москва) Я.А. Краева (секционный доклад). PDF (диплом II степени в конкурсе докладов молодых ученых)
  5. Международная научная конференция «Параллельные вычислительные технологии 2023» (28–30 марта 2023 г., Санкт-Петербург) А.А. Юртин (секционный доклад). Параллельное вычисление функции потерь на графическом процессоре для нейросетевых моделей восстановления временных рядов PDF (диплом II степени в конкурсе докладов молодых ученых)
  6. Международная научная конференция «Параллельные вычислительные технологии 2023» (28–30 марта 2023 г., Санкт-Петербург) Я.А. Краева (секционный доклад). Автоматизированный поиск аномалий временных рядов на графическом процессоре PDF (диплом II степени в конкурсе докладов молодых ученых)
  7. Международная научная конференция «Параллельные вычислительные технологии 2023» (28–30 марта 2023 г., Санкт-Петербург), А.И. Гоглачев (секционный доклад). Автоматизированная разметка больших временных рядов на кластере с GPU узлами PDF (диплом III степени в конкурсе докладов молодых ученых)
  8. Международная научная конференция «Параллельные вычислительные технологии 2023» (28–30 марта 2023 г., Санкт-Петербург), А.Н. Полуянов (секционный доклад). Восстановление пропущенных значений в потоковом временном ряде с применением центрального и графического процессоров PDF

Научные отчеты по проекту

Будет добавлено позднее.

 
Изменено: 28.11.2023

Copyright © М.Л. Цымблер