TRSM006 Проект: Извличане на лексикални и граматични колокации

Анотация:

Да даде възможност на студентите да практикуват техники за работа с корпуси в търсене на конфигурации от граматически и лексикални средства, както и аналитично извличане на структури от корпуси.

прочети още
Писмен и устен превод

Преподавател(и):

ас. Петя Петкова - Сталева  д-р
доц. Венета Сиракова  д-р
доц. Елена Тарашева  д-р
доц. Мариана Малинова  д-р
преп. Анжела Ангелова  
 Ирина Георгиева  д-р

Описание на курса:

Компетенции:

Успешно завършилите курса студенти:

1) знаят:

• Публично достъпни корпуси

• Техники и методи за работа с корпусите

2) могат:

• Извличат информация за граматически и лексикални конфигурации в корпуси

• Да анализират конфигурациите предвид статическа значимост, текстови характеристики и жанрови особености


Предварителни изисквания:
• Владеене на чужд език на ниво не по-ниско от Б2 по ЕРЕ

Форми на провеждане:
Редовен

Учебни форми:
Проект

Език, на който се води курса:
Български

Теми, които се разглеждат в курса:

  1. Колокации и колигации
  2. Контекст в ляво и дясно от ключова дума
  3. Използване на мофрологично-анотирани корпуси
  4. Извличане на колокати от различни жанрове

Литература по темите:

Biber, D. S. Conrad, R. Reppen.1998. Corpus Linguistics: Investigating Language Structure and Use. CUP.

Hunstan, S. 2002. Corpora in Applied Linguistics. CUP.

Hunstan, S. and G. Francis. 2000. Pattern Grammar. John Benjamins Publishing Company.

Коева, Св. Граматичен речник на българския език. Описание на концепцията за организацията на лингвистичните данни, в: Български език, 6, 1998, с. 49-58.

Осенова, П. 2016. Граматическо моделиране на българския език (с оглед на автоматичната обработка на естествен език). Парадигма.

Corpora:

https://corpus.byu.edu/

http://bultreebank.org/bg/btb/