DSCM039 Обработка на естествен език
Анотация:
Курсът продължава, разширява и задълбочава започнатото в DSCM043 запознанство с обработката на естествен език.
Преподавател(и):
доц. Иван Держански д-р
Описание на курса:
Компетенции:
Успешно завършилите курса студенти:
1) разбират:
• подходите към моделирането на синтактични и семантични явления, прилагани при обработката на естествен език (ОЕЕ);
• ролята на невронните мрежи и приложението им в ОЕЕ;
• съвременните методи за прилагане на статистика в машинния превод;
• техниките от машинното самообучение, употребявани в ОЕЕ.
2) могат:
• да обясняват и прилагат основните техники от областта на ОЕЕ;
• да разработват, реализират и тестват алгоритми за задачи от ОЕЕ.
Предварителни изисквания:
• DSCM043 Увот в обработката на естествен език
• програмиране на Python
Форми на провеждане:
Редовен
Учебни форми:
Лекция
Език, на който се води курса:
Български
Теми, които се разглеждат в курса:
- Синтаксис. Граматики
- Синтактичен анализ
- Зависимостна граматика
- Композиционна семантика
- Извличане на информация
- Лексикално-семантични мрежи
- Семантични роли
- Невронни мрежи
- Рекурентни невронни мрежи
- ДКСП. Трансформатори
- Машинен превод 1
- Машинен превод 2
- Машинен превод 3
- Разрешаване на кореферентност
- Клъстеризация
Литература по темите:
* Jurafsky, Daniel and James H. Martin. Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition. 3rd ed. draft (https://web.stanford.edu/~jurafsky/slp3/ed3book.pdf)
* Manning, Christopher D. and Hinrich Schütze. Foundations of Statistical Natural Language Processing. 1999.
* Koehn, Philipp. Statistical Machine Translation. 2010.