Извличане на знания и технологии за големи данни

Кратко представяне на програмата:

Темпът на търсене на специалисти с анализаторски умения е сред най-високите в IT сферата, като тази тенденция е устойчива. Двигател на този ръст e постоянно увеличаващия се обем от съхранени, слабоструктурирани данни, анализът на които води до важни и неочевидни резултати. Уменията, които са с най-висок ръст на търсене (между 17% и 40%) и които настоящата магистърска програма последователно развива у студентите, са машинно обучение, облачни технологии, визуализиране на данни, семантичен анализ и моделиране.

Програмата предлага подготовка по методи за анализ на данни с цел извличане на знания, както и по технологии за съхранение на големи обеми от данни (Big Data). Подбраните курсове съответстват на най-добрите практики в образованието по науката за данните (data science), статистическото моделиране (statistical modeling), машинното обучение (machine learning), визуализирането на данни (data visualization), методите за семантичен анализ (semantic analysis) и високопроизводителните изчисления (high-performance computing). Знанията ще бъдат приложени за разпознаване на изображения и звук, обработка на естествен език, откриване на редки събития в действащи физически мегаексперименти и др. Голяма част от аудиторните курсове има проект. Третият семестър включва практически стаж. Сред преподавателския екип са: проф. д-р Красимир Манев (НБУ), проф. д-р Михаил Тодоров (ТУ-София), проф. д-р Стоян Малешков (НБУ), доц. д-р Димитър Атанасов (НБУ), доц. д-р Ласко Ласков (НБУ), доц. д-р Петя Асенова (НБУ), д-р Росица Голева (НБУ), д-р Стоян Мишев (НБУ), Пано Панов (НБУ), д-р Петър Христов (CERN), д-р Владимир Алексиев (Ontotext), Мартин Кръстев (Chaos Group), Иван Боршуков (Chaos Group), Антон Андонов (Quanterall).

Обучението в програмата следва практически подход, като в достъпна форма се дават основните достижения в областите на статистическото обучение, семантичното моделиране, паралелното изпълнение на компютърни програми, както и технологиите за съхранение и обработка на големи обеми от данни. Повечето практически задачи, които се решават в тренинговите курсове, са формулирани от експерти по различните направления, работещи в сътрудничащи на програмата организации. Изследователската компонента е важна за дейността на всеки анализатор на данни, поради което в курсовете се обсъждат актуални задачи от различни сфери на науката. Прякото приложение на научените знания е обяснено от лекторите в програмата, които активно работят в областта на научните изследвания. За обучението се използват компютърните зали на НБУ. В курсовете по облачни технологии и обработка на големи данни се използват ресурси на Amazon, Microsoft и Google.

Успешно завършилите студенти могат да продължат професионалното си развитие като анализатори на данни, водещи до вземане на решения, както в корпоративна среда, така и в средни и големи предприятия. Индустриите, в които нуждата от аналитични знания и умения са най-значителни са производството, информационните технологии и телекомуникациите, финансите и застраховането.

прочети още
Извличане на знания и технологии за големи данни
  • проф. д-р Кирил Симов DSCM039 Обработка на естествен език
  • проф. д-р Красимир Манев DSCM004 Конкурентно програмиране DSCM009 Проект: Конкурентно програмиране DSCM016 Паралелно програмиране DSCM022 Проект: Паралелно програмиране
  • проф. д-р Стоян Малешков DSCM014 Визуализация на данни DSCM020 Проект: Визуализация на данни
  • проф. Михаил Тодоров DSCM002 Матрични изчисления DSCM010 Проект: Матрични изчисления DSCM038 Тензорно смятане
  • доц. д-р Димитър Атанасов DSCM013 Вероятности и статистика за извличане на знания от данни DSCM030 Теория на данните DSCM032 Проект: Теория на данните
  • доц. д-р Ласко Ласков DSCM026 Обработка на изображения и разпознаване на образи
  • доц. д-р Морис Гринберг DSCM011 Прогнозиране чрез анализ на данни - II част. Невронни мрежи DSCM023 Прогнозиране чрез анализ на данни III. Машинно обучение с TensorFlow
  • доц. д-р Петя Асенова DSCM021 Проект: Анализ на бизнес данни – II част DSCM027 Анализ на бизнес данни – III част
  • доц. д-р Ясен Горбунов DSCM024 Мрежа за съхраняване на данни DSCM028 Високопроизводителни изчисления
  • гл. ас. д-р Иван Ванков DSCM039 Обработка на естествен език
  • гл. ас. д-р Росица Голева DSCM024 Мрежа за съхраняване на данни
  • гл. ас. д-р Слав Ангелов DSCM013 Вероятности и статистика за извличане на знания от данни DSCM019 Проект: Вероятности и статистика за извличане на знания от данни
  • гл. ас. д-р Стоян Мишев DSCM001 Прогнозиране чрез анализ на данни – I част DSCM005 Изграждане на приложения за големи данни DSCM006 Проект: Прогнозиране чрез анализ на данни – I част DSCM008 Проект: Изграждане на приложения за големи данни - I DSCM011 Прогнозиране чрез анализ на данни - II част. Невронни мрежи DSCM017 Проект: Прогнозиране чрез анализ на данни - II част DSCM023 Прогнозиране чрез анализ на данни III. Машинно обучение с TensorFlow DSCM028 Високопроизводителни изчисления DSCM029 Стаж DSCM034 Софтуерни архитектури за машинно обучение DSCM035 Проект: Софтуерни архитектури за машинно обучение
  • д-р Владимир Алексиев DSCM031 Семантични технологии DSCM033 Проект: Сематични технологиии DSCM036 Семантични Технологии - част 2 DSCM037 Проект: Семантични Технологии - част 2
  • д-р Никола Тулечки DSCM031 Семантични технологии DSCM036 Семантични Технологии - част 2 DSCM037 Проект: Семантични Технологии - част 2
  • д-р Петър Христов DSCM001 Прогнозиране чрез анализ на данни – I част DSCM011 Прогнозиране чрез анализ на данни - II част. Невронни мрежи DSCM023 Прогнозиране чрез анализ на данни III. Машинно обучение с TensorFlow
  • Антон Андонов DSCM004 Конкурентно програмиране DSCM009 Проект: Конкурентно програмиране
  • Иван Боршуков   DSCM004 Конкурентно програмиране
  • Мартин Кръстев   DSCM028 Високопроизводителни изчисления