DSCM039 Обработка на естествен език

Анотация:

Курсът продължава, разширява и задълбочава започнатото в DSCM043 запознанство с обработката на естествен език.

прочети още
Извличане на знания и технологии за големи данни

Преподавател(и):

доц. Иван Держански  д-р

Описание на курса:

Компетенции:

Успешно завършилите курса студенти:

1) разбират:

• подходите към моделирането на синтактични и семантични явления, прилагани при обработката на естествен език (ОЕЕ);

• ролята на невронните мрежи и приложението им в ОЕЕ;

• съвременните методи за прилагане на статистика в машинния превод;

• техниките от машинното самообучение, употребявани в ОЕЕ.

2) могат:

• да обясняват и прилагат основните техники от областта на ОЕЕ;

• да разработват, реализират и тестват алгоритми за задачи от ОЕЕ.
Предварителни изисквания:
• DSCM043 Увот в обработката на естествен език

• програмиране на Python

Форми на провеждане:
Редовен

Учебни форми:
Лекция

Език, на който се води курса:
Български

Теми, които се разглеждат в курса:

  1. Синтаксис. Граматики
  2. Синтактичен анализ
  3. Зависимостна граматика
  4. Композиционна семантика
  5. Извличане на информация
  6. Лексикално-семантични мрежи
  7. Семантични роли
  8. Невронни мрежи
  9. Рекурентни невронни мрежи
  10. ДКСП. Трансформатори
  11. Машинен превод 1
  12. Машинен превод 2
  13. Машинен превод 3
  14. Разрешаване на кореферентност
  15. Клъстеризация

Литература по темите:

* Jurafsky, Daniel and James H. Martin. Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition. 3rd ed. draft (https://web.stanford.edu/~jurafsky/slp3/ed3book.pdf)

* Manning, Christopher D. and Hinrich Schütze. Foundations of Statistical Natural Language Processing. 1999.

* Koehn, Philipp. Statistical Machine Translation. 2010.