DSCM001 Прогнозиране чрез анализ на данни – I част

Анотация:

Курсът е практически увод в машинното (само)обучение (МО) - една от най-динамичните области в съвременните информационни технологии. Структурата на курса е повлияна от популярните лекции на Андрю Нг от платформата Coursera. Студентите ще се запознаят с линейната и логистичната регресия, ще приложат дървета за вземане на решения и метода на опорните вектори. Допълнително ще бъдат разгледани методи на машинно обучение без обучаваща извадка: клъстеризация и метод на главните компоненти. В заключителната част студентите ще се запознаят с приложението на МО във физиката на високите енергии за идентификация на елементарни частици. Курсът ще използва езикът Python и Jupyter notebooks за практическа реализация на алгоритмите. Ще бъде направен и обзор на различни системи и пакети за МО.

прочети още
Извличане на знания и технологии за големи данни

Преподавател(и):

 Стоян Мишев  д-р
 Петър Христов  д-р

Описание на курса:

Компетенции:

Успешно завършилите курса студенти:

1) знаят:

- Класификацията на методите за машинно саообучение;

- Основните алгоритми за МО;

- Предимствата и недостатъците на методите за МО;

- Как да изберат подходящ метод за машинно самообучение при решаването на конкретна задача;

- Насоките в съвременните методи за МО.

2) могат:

- Да приложат методите класификация на текст и обекти, разпознаване на изображения, клъстеризация, идентификация с помощта на дървета за вземане на решения и метода на опорни вектори;

- Да се ориентират в различните алгоритми, библиотеки и програмни пакети за МО;

- Да търсят и намират ефективни решения на проблеми, изискващи МО.


Предварителни изисквания:
Желателни са основни познания по езика Python.

Форми на провеждане:
Редовен

Учебни форми:
Лекция

Език, на който се води курса:
Български

Теми, които се разглеждат в курса:

  1. Въведение в курса
  2. Линейна регресия с една променлива
  3. Линейна регресия с много променливи
  4. Мащабиране. Регуляризация.
  5. Логистична регресия
  6. Вероятностно представяне. Регуляризация на логистична регресия. Линейна регресия с тегла.
  7. Метод на опорните вектори
  8. Решаване на задачи. Въведение в Scikit-learn.
  9. Контролно 1
  10. Софтуерни инструменти за Data Science
  11. Метод на опорните вектори 2
  12. Метод на опорните вектори 3
  13. Метод на главните компоненти
  14. Дърво на решения
  15. Дърво на решения 2
  16. Домашни задания
  17. Контролно 2

Литература по темите:

Shigeo Abe, Support Vector Machines for Pattern Classification, 2005

Daniel Larose, Chantal Larose, Data mining and predictive analytics, Wiley, 2016

Marc Peter Deisenroth, A. Aldo Faisal and Cheng Soon Ong, Mathematics for Machine Learning, 2019

Yaser S. Abu-Mostafa, Malik Magdon-Ismail, and Hsuan-Tien Lin, Learning From Data, 2012

Lars Eldén, Matrix Methods in Data Mining and Pattern Recognition, SIAM, 2019

C. Bishop, Pattern recognition and machine learning