|
►
Участники
проекта
Руководитель проекта:
Цымблер Михаил
Леонидович (mzym@susu.ru)
Основные исполнители проекта:
►
Аннотация
проекта
Целью проекта являются
разработка и исследование новых моделей, методов и алгоритмов,
обеспечивающих эффективный интеллектуальный анализ данных временных
рядов в режиме реального времени на основе совместного применения
нейросетевых и параллельных вычислительных технологий. Актуальность
решения указанной научной проблемы обусловлена необходимостью
теоретических методов и практических разработок, обеспечивающих
эффективный интеллектуальный анализ данных временных рядов, которые в
настоящее время возникают в широком спектре предметных областей:
предиктивное техобслуживание оборудования в приложениях цифровой
индустрии, интеллектуальное управление зданиями в приложениях Интернета
вещей, мониторинг состояния человека и упреждающая диагностика
заболеваний в приложениях персональной медицины и др. В настоящее время
технологии нейронных сетей оказывают огромное влияние на сферу
информационных технологий и применяются для решения широкого спектра
задач, в т.ч. в приложениях, связанных с анализом и прогнозом временных
рядов в режиме реального времени. Нейросети потенциально способны
обеспечить высокое качество анализа и прогноза временных рядов и
приемлемую для реального времени скорость работы. Однако для обучения
нейросетей необходим большой объем предварительно очищенных и
размеченных данных. В то же время очистка и разметка данных, выполняемые
в ручном режиме экспертом в данной предметной области, порождает
существенные накладные расходы. Научная новизна предлагаемого
исследования заключается в следующем. Решение задач анализа и
прогнозирования временных рядов в режиме реального времени выполняется с
помощью нейросетевых моделей, для которых разрабатываются параллельные
алгоритмы интеллектуального анализа временных рядов для современных
многоядерных процессоров и графических ускорителей. Указанные алгоритмы
применимы к временным рядам из любой предметной области без
необходимости использования знаний и/или обучающих данных из этой
области. Данные параллельные алгоритмы для массово распространенных в
настоящее время указанных платформ позволят выполнять разметку данных
обучающей выборки для нейросети в автоматизированном режиме и
существенно сократить затраты на разметку данных (по сравнению с
разметкой, выполняемую экспертом вручную). Кроме того, указанные выше
нейросетевые модели и параллельные алгоритмы интегрируются в СУБД с
открытым кодом. В настоящее время СУБД являются стандартным средством
реализации хранилищ данных, которые обеспечивают безопасность,
целостность данных, язык запросов и манипулирования данными и др. Однако
СУБД штатно не обеспечивают интеллектуальный анализ хранимых данных.
Внедрение указанных механизмов в СУБД позволит инкапсулировать стадии
сбора и анализа данных в рамках одной среды и избежать существенных
накладных расходов по экспорту данных во внешнюю аналитическую систему и
импорту результатов анализа в хранилище данных.
►
Публикации по проекту
Основные
результаты, полученные в ходе выполнения данного проекта, опубликованы в
следующих работах:
2024 г. |
- Kraeva Ya., Zymbler M. PADDi: Highly Scalable Parallel
Algorithm for Discord Discovery on Multi-GPU Clusters // Lobachevskii
Journal of Mathematics. 2025. Vol. 46, No. 1. (принято к публикации)
PDF
- Yurtin A., Zymbler M. SANNI: Online Imputation of Missing Values in
Multivariate Time Series Based on Deep Learning and Behavioral Patterns
// Lobachevskii Journal of Mathematics. 2024. Vol. 45, No. 11. (принято
к публикации) PDF
- Zymbler M., Goglachev A. PaSTiLa: Scalable Parallel Algorithm
for Unsupervised Labeling of Long Time Series // Lobachevskii
Journal of Mathematics. 2024. Vol. 45, No. 3. P. 1333–1347.
PDF DOI:
10.1134/S1995080224600766
WOS:001272973100030
Scopus
РИНЦ
- Гоглачев А.И. Классификация потокового временного ряда на основе
нейросетевых технологий и поведенческих шаблонов // Вестник ЮУрГУ.
Серия: Вычислительная математика и информатика. 2024. Т. 13, № 3. С.
79–94.
PDF
DOI: 10.14529/cmse240305
РИНЦ
- Юртин А.А. Восстановление многомерных временных рядов на основе
выявления поведенческих шаблонов и применения автоэнкодеров // Вестник
ЮУрГУ. Серия: Вычислительная математика и информатика. 2024. Т. 13, № 2.
С. 39–55.
PDF DOI:
10.14529/cmse240203
РИНЦ
- Краева Я.А. Нейросетевой метод обнаружения аномалий в многомерных
потоковых временных рядах // Вестник ЮУрГУ. Серия: Вычислительная
математика и информатика. 2024. Т. 13, № 4. С. 35–52.
PDF
DOI: 10.14529/cmse240403
РИНЦ
- Юртин А.А. Об одной функции потерь для обучения нейросетевых моделей
восстановления временных рядов // Вестник ЮУрГУ. Серия: Вычислительная
математика и информатика. 2024. Т. 13, № 4. С. 53–73.
PDF
DOI: 10.14529/cmse240404
РИНЦ
- Юртин А.А. Интеграция в реляционную СУБД средств восстановления
пропусков временных рядов в режиме реального времени // Вестник ЮУрГУ.
Серия: Вычислительная математика и информатика. 2025. Т. 14, № 1.
(принято к публикации)
|
2023 г.
|
- Zymbler M., Kraeva Y. High-Performance Time Series Anomaly
Discovery on Graphics Processors // Mathematics. 2023. Vol. 11, No.
14. Article 3193. PDF DOI:
10.3390/math11143193
WOS:001039018700001
Scopus
РИНЦ
- Kraeva Y., Zymbler M. A Parallel Discord Discovery Algorithm for a
Graphics Processor // Pattern Recognition and Image Analysis. 2023.
Vol. 33, no. 2. P. 101–112. PDF DOI:
10.1134/S1054661823020062
WOS:001022883000004
Scopus РИНЦ
- Краева Я.А. Обнаружение аномалий временного ряда на основе
технологий интеллектуального анализа данных и нейронных сетей //
Вестник ЮУрГУ. Серия: Вычислительная математика и информатика. 2023.
Т. 12, № 3. С. 50–71.
PDF DOI:
10.14529/cmse230304
РИНЦ
- Цымблер М.Л., Юртин А.А. Восстановление пропущенных значений
временного ряда на основе совместного применения аналитических
алгоритмов и нейронных сетей // Вычислительные методы и
программирование. 2023. Т. 24, № 3. С. 243–259. PDF DOI:
10.26089/NumMet.v24r318
РИНЦ
- Краева Я.А. Поиск аномалий в сенсорных данных цифровой индустрии с
помощью параллельных вычислений // Вестник ЮУрГУ. Серия:
Вычислительная математика и информатика. 2023. Т. 12, № 2. С. 47–61.
PDF
DOI: 10.14529/cmse230202
РИНЦ
- Краева Я.А., Цымблер М.Л. Поиск аномалий в больших
временных рядах на кластере с GPU узлами // Вычислительные методы и
программирование. 2023. Т. 24, № 3. С. 291–304.
PDF DOI: 10.26089/NumMet.v24r321
РИНЦ
- Краева Я.А., Цымблер М.Л. Поиск аномалий в больших временных рядах
на кластере с GPU узлами // Суперкомпьютерные дни в России: Труды
международной конференции (25–26 сентября 2023 г., Москва). М.: МАКС
Пресс, 2023. С. 149–160. PDF
DOI:
10.29003/m3478.978-5-317-07070-0
РИНЦ
|
►
Апробация проекта
Основные результаты, полученные в ходе выполнения данного проекта, докладывались на следующих научных
конференциях, семинарах и совещаниях:
2024 г. |
- DAMDID/RCDL’2024: XXVI
International Conference on Data Analytics and Management in Data
Intensive Domains (23–25 October 2024, Nizhny Novgorod, Russia).
Time reveals all things: Leveraging behavioral patterns for anomaly
detection and event prediction in time series.
М.Л.
Цымблер (пленарный доклад).
PDF
- Всероссийская научная конференция с международным участием «Параллельные
вычислительные технологии 2024» (2–4 апреля 2024 г., Челябинск).
Восстановление пропусков многомерного временного ряда на основе анализа
поведенческих шаблонов. А.А. Юртин (секционный доклад)
PDF
(диплом I степени в конкурсе докладов
молодых ученых)
- Всероссийская научная конференция с международным участием «Параллельные
вычислительные технологии 2024» (2–4 апреля 2024 г., Челябинск).
Метод поиска аномалий временного ряда в режиме реального времени. Я.А.
Краева (секционный доклад) PDF
(диплом II степени в конкурсе докладов
молодых ученых)
|
2023 г.
|
-
Всероссийская научная конференция с международным участием ЦИСП'2023: Цифровая
индустрия: состояние и перспективы развития (21–23 ноября 2023 г.,
Челябинск).
Интеллектуальный анализ временных рядов в задачах цифровой
индустрии. М.Л.
Цымблер (пленарный доклад).
PDF
-
DAMDID/RCDL’2023: XXV
International Conference on Data Analytics and Management in Data
Intensive Domains (24–27 October 2023, Moscow, Russia).
Discord discovery in time series. М.Л.
Цымблер (пленарный доклад).
PDF
-
Международная научная конференция
«Суперкомпьютерные дни в
России» (25–26 сентября 2023 г., Москва). Поиск аномалий в
больших временных рядах на кластере с GPU узлами. Я.А. Краева (секционный
доклад). PDF (диплом II степени в конкурсе докладов
молодых ученых)
-
Всероссийская научная конференция с международным участием «Параллельные
вычислительные технологии 2023» (28–30 марта
2023 г., Санкт-Петербург) А.А. Юртин (секционный доклад).
Параллельное вычисление функции потерь на графическом процессоре для
нейросетевых моделей восстановления временных рядов PDF
(диплом II степени в конкурсе докладов
молодых ученых)
-
Всероссийская научная конференция с международным участием «Параллельные
вычислительные технологии 2023» (28–30 марта
2023 г., Санкт-Петербург) Я.А. Краева (секционный доклад).
Автоматизированный поиск аномалий временных рядов на графическом
процессоре PDF
(диплом II степени в конкурсе докладов
молодых ученых)
-
Всероссийская научная конференция с международным участием «Параллельные
вычислительные технологии 2023» (28–30 марта
2023 г., Санкт-Петербург), А.И. Гоглачев (секционный доклад).
Автоматизированная разметка больших временных рядов на кластере с
GPU узлами PDF
(диплом III степени в конкурсе докладов
молодых ученых)
-
Всероссийская научная конференция с международным участием «Параллельные
вычислительные технологии 2023» (28–30 марта
2023 г., Санкт-Петербург), А.Н. Полуянов (секционный доклад).
Восстановление пропущенных значений в потоковом временном ряде с
применением центрального и графического процессоров PDF
|
►
Зарегистрированные программы
-
Краева Я.А., Цымблер M.Л. Свидетельство Роспатента о государственной
регистрации программы для ЭВМ «PADDi: параллельная программа для
поиска аномалий временного ряда на кластерных вычислительных
системах с графическими процессорами» № 2024690693 от 17.12.2024
PDF
ФИПС
-
Краева Я.А. Свидетельство Роспатента о государственной регистрации
программы для ЭВМ «DiSSiD: детектор аномалий временного ряда в
режиме реального времени» № 2023685034 от 21.11.2023.
PDF РИНЦ
ФИПС
-
Гоглачев А.И., Цымблер M.Л. Свидетельство Роспатента о
государственной регистрации программы для ЭВМ «PaSTiLa:
параллельная программа для автоматизированной разметки длинных
временных рядов» № 2023688858 от 25.12.2023
PDF
РИНЦ
ФИПС
-
Подседов М.С., Юртин А.А., Цымблер М.Л. Свидетельство Роспатента о
государственной регистрации программы для ЭВМ «Расширение СУБД для
автоматизации интеллектуального анализа временных рядов» №
2024688988 от 03.12.2024.
PDF
ФИПС
►
Репозитории
-
SALTO, нейросетевой метод классификации
подпоследовательностей временного ряда в режиме реального времени:
https://github.com/goglachevai/SALTO
-
PaSTiLa, параллельный алгоритм поиска
сниппетов (поведенческих шаблонов) временного ряда на вычислительном
кластере с графическими процессорами:
https://github.com/goglachevai/PaSTiLA
-
PD3, параллельный алгоритм поиска диссонансов
временного ряда, имеющих фиксированную длину, на графическом
процессоре:
https://github.com/kraevaya/PD3
-
PALMAD, параллельный алгоритм поиска
диссонансов временного ряда, имеющих произвольную длину, на
графическом процессоре:
https://github.com/kraevaya/PALMAD
-
PADDi, параллельный алгоритм поиска
диссонансов временного ряда, имеющих произвольную длину, на
вычислительном кластере с графическими процессорами:
https://github.com/kraevaya/PADDi
-
DiSSiD, нейросетевой метод обнаружения
аномалий временного ряда в режиме реального времени:
https://github.com/kraevaya/DiSSiD
-
mDiSSiD, нейросетевой метод обнаружения
аномалий многомерного временного ряда в режиме реального времени:
https://github.com/kraevaya/mDiSSiD
-
SANNI, нейросетевой метод восстановления
пропусков многомерного временного ряда в режиме реального времени:
https://github.com/yurtinaa/SANNI
-
SAETI, нейросетевой метод восстановления
пропусков многомерного временного ряда:
https://github.com/yurtinaa/SAETI
-
ImputeDB, метод восстановления пропусков
временных рядов, хранимых в СУБД PostgreSQL, в режиме реального
времени:
https://github.com/yurtinaa/ImputeDB
-
TSDB, проблемно-ориентированное расширение
СУБД PostgreSQL для интеллектуального анализа временных рядов:
https://github.com/yurtinaa/TSDB
►
Диссертации
Краева Я.А. Масштабируемые методы и алгоритмы поиска аномалий
во временных рядах. Диссертация на соискание ученой степени
кандидата физико-математических наук по специальности 2.3.5.
«Математическое и программное обеспечение вычислительных систем,
комплексов и компьютерных сетей» в диссертационном совете 24.2.437.10
при Южно-Уральском
государственном университете 22 мая 2024 г.
Автореферат (PDF) Диссертация (PDF) Презентация
(PDF)
|