DSCM043 Увод в обработката на естествен език
Анотация:
Курсът запознава слушателите с основните понятия, задачи, методи и техники от обработката на естествен език.
Преподавател(и):
доц. Иван Держански д-р
Описание на курса:
Компетенции:
Успешно завършилите курса студенти:
1) разбират:
• същността и спецификата на задачите на обработката на естествен език (ОЕЕ);
• подходите към текстообработката със средствата, вградени в Unix/Linux;
• класическите и съвременните методи за езиково моделиране, класификация на текстове, изискване на информация, разпознаване на части на речта и именувани същини.
2) могат:
• да обясняват и прилагат основните техники от областта на ОЕЕ;
• да разработват, реализират и тестват алгоритми за задачи от ОЕЕ.
Предварителни изисквания:
Следните знания и/или умения се очакват от студентите:
• програмиране на Python;
• (желателно) запознанство с Unix/Linux поне на основно равнище.
Форми на провеждане:
Редовен
Учебни форми:
Лекция
Език, на който се води курса:
Български
Теми, които се разглеждат в курса:
- Що е обработка на естествен език?
- Естествен език. Многозначност
- Езикови корпуси
- Елементарна текстообработка 1
- Елементарна текстообработка 2
- Лингвистична дешифровка. Редакционно разстояние
- Езикови модели. Вероятност
- Езикови модели. Изглаждане
- Класификация на текстове. Бейсов класификатор
- Перцептрон. Логистична регресия
- Изискване на информация 1
- Изискване на информация 2
- Векторна семантика
- Части на речта и именувани същини
- Колокации
Литература по темите:
* Jurafsky, Daniel and James H. Martin. Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition. 3rd ed. draft (https://web.stanford.edu/~jurafsky/slp3/ed3book.pdf)
* Manning, Christopher D. and Hinrich Schütze. Foundations of Statistical Natural Language Processing. 1999.