Значителна част от информацията днес съществува в неструктуриран вид под формата на текст, което силно затруднява автоматичната й обработка. В много случаи, компютърната лингвистика може да предложи решение на този проблем.
Целта на курса по „Практическа компютърна лингвистика – статистически подход” е да запознае студентите с някои от най-важните съвременни постижения на компютърната лингвистика, с акцент върху описанието на конкретни алгоритми и оценка на това доколко добре те работят в реални компютърни приложения. Курсът покрива широк спектър от задачи като търсене в големи текстови масиви, извличане на факти, категоризиране, клъстеризиране и резюмиране на текст, решаване на различни проблеми на синтаксиса и семантиката, автоматично отговаряне на въпроси, машинен превод, и др.
Курсът е подходящ за начинаещи, и бил особено полезен за студенти, слушали курса по „Компютърна лингвистика” на доц. Галя Ангелова.
Всички материали по курса (презентации, допълнителни текстове, връзки към програмни средства и др.) ще се поддържат в електронна форма в Интернет.