TL;DR: Этой осенью сообщество Open Data Science и компания Huawei делают новый запуск курса по обработке естественного языка. Вот страница нашего курса. Для того, чтобы его пройти, нужно зарегистрироваться.
![Speech and Semantics Speech and Semantics](https://habrastorage.org/getpro/habr/upload_files/4b6/3b2/951/4b63b29517b7cc37c169fa879631441a.png)
Всем привет! Мы делаем новый запуск курса Natural Language Processing. Курс состоит из основных 10 занятий, посвященных разным ключевым темам NLP. Если кратко:
Закон Ципфа;
TF-IDF;
Word2Vec;
RNN;
CNN;
Transformer.
Это набор инструментов, но конечно мы рассмотрим и задачи - классификации текста, тэггирования, генерации, включая само собой всеми любимый машинный перевод. Каждое занятие будет состоять из лекции и семинара. Полный syllabus курса можно посмотреть здесь.
В этом запуске будет новая тема - применение методов NLP в задачам разработки программного обеспечения (NLP4Code, AI4SE). Если вам было интересно, как устроен Github Copilot или OpenAI Codex, то присоединятесь.
Также в курсе будет два задания, одно на вышеупомянутый Word2Vec, одно в виде соревнования наподобие тех, что проводят на платформе Kaggle. Помимо 10 основных занятий, будет еще две (или как получится) гостевых лекции, посвященные связанным с NLP темам от специалистов в этих темах. В прошлые запуски курса были лекции про обработку и генерацию речи, информационному поиску, графам знаний.
Лекции и семинары будут онлайн. Помимо этого мы сделали для части лекций на платформе курса нарезку из роликов по отдельным темам для удобства слушателей. После каждой лекции будет квиз. Сдача заданий и квизов будет происходить на платформе ODS. Самое важное, на мой взгляд, что большую часть курса составляет создание собственного проекта. Проект - это произведение одного или нескольких людей, которые делают одну программу, модель машинного обучения либо корпус текстов. Список проектов с прошлых запусков выложен вот тут.
Пару слов о ведущих курса. Я буду читать лекции, в области NLP я работаю последние 10 лет, успел поработать в Яндексе и ВКонтакте, защитить кандидатскую диссертацию. Больше информации про меня здесь. Сам курс запускается в этом виде в пятый раз. В других инкарнациях он был уже около десятка раз, так что с одной стороны есть сообщество выпускников, с которыми можно кооперироваться для выполнения проектов, с другой многие (хотя, конечно, не все) острые углы удалось сгладить. Также в этом запуске мы сотрудничаем сразу с тремя вузами: МГТУ им. Баумана, ИТМО и ВШЭ. Если вы студент одного из этих вузов, то можно попробовать зачесть курс, как учебный.
В этом запуске все общение по курсу будет концентрировать в группе в Telegram.
Лекции будут проходить по средам в 19:50. Ссылка будет в группе курса. Первое занятие - уже в эту среду, 14 сентября!
Надеюсь, я вас заинтересовал, еще раз ссылка на курс.