Аннотация курса

  • Введение в дисциплину. Феномен Больших данных. Понятие интеллектуального анализа данных. Технологический цикл анализа данных. Основные задачи интеллектуального анализа данных.
  • Поиск шаблонов. Понятия транзакции, частого набора, шаблона, поддержки, достоверности. Основные алгоритмы поиска частых наборов. Выбор полезных шаблонов. 
  • Классификация. Процесс классификации: обучение модели, оценка модели, применение модели. Деревья решений. Оценка качества классификации. Ансамблевая классификация.
  • Кластеризация. Задачи кластеризации данных и подходы к ее решению. Разделительная кластеризация. Иерархическая кластеризация. Меры качества кластеризации.

Слайды к лекциям

  • Введение PDF
  • Поиск шаблонов PDF
  • Классификация PDF
  • Кластеризация PDF