TL;DR: Этой осенью сообщество Open Data Science и компания Huawei делают новый запуск курса по обработке естественного языка. Вот страница нашего курса. Для того, чтобы его пройти, нужно зарегистрироваться.

Speech and Semantics

Всем привет! Мы делаем новый запуск курса Natural Language Processing. Курс состоит из основных 10 занятий, посвященных разным ключевым темам NLP. Если кратко:

  • Закон Ципфа;

  • TF-IDF;

  • Word2Vec;

  • RNN;

  • CNN;

  • Transformer.

Это набор инструментов, но конечно мы рассмотрим и задачи - классификации текста, тэггирования, генерации, включая само собой всеми любимый машинный перевод. Каждое занятие будет состоять из лекции и семинара. Полный syllabus курса можно посмотреть здесь.

В этом запуске будет новая тема - применение методов NLP в задачам разработки программного обеспечения (NLP4Code, AI4SE). Если вам было интересно, как устроен Github Copilot или OpenAI Codex, то присоединятесь.

Также в курсе будет два задания, одно на вышеупомянутый Word2Vec, одно в виде соревнования наподобие тех, что проводят на платформе Kaggle. Помимо 10 основных занятий, будет еще две (или как получится) гостевых лекции, посвященные связанным с NLP темам от специалистов в этих темах. В прошлые запуски курса были лекции про обработку и генерацию речи, информационному поиску, графам знаний.

Лекции и семинары будут онлайн. Помимо этого мы сделали для части лекций на платформе курса нарезку из роликов по отдельным темам для удобства слушателей. После каждой лекции будет квиз. Сдача заданий и квизов будет происходить на платформе ODS. Самое важное, на мой взгляд, что большую часть курса составляет создание собственного проекта. Проект - это произведение одного или нескольких людей, которые делают одну программу, модель машинного обучения либо корпус текстов. Список проектов с прошлых запусков выложен вот тут.

Пару слов о ведущих курса. Я буду читать лекции, в области NLP я работаю последние 10 лет, успел поработать в Яндексе и ВКонтакте, защитить кандидатскую диссертацию. Больше информации про меня здесь. Сам курс запускается в этом виде в пятый раз. В других инкарнациях он был уже около десятка раз, так что с одной стороны есть сообщество выпускников, с которыми можно кооперироваться для выполнения проектов, с другой многие (хотя, конечно, не все) острые углы удалось сгладить. Также в этом запуске мы сотрудничаем сразу с тремя вузами: МГТУ им. Баумана, ИТМО и ВШЭ. Если вы студент одного из этих вузов, то можно попробовать зачесть курс, как учебный.

В этом запуске все общение по курсу будет концентрировать в группе в Telegram.

Лекции будут проходить по средам в 19:50. Ссылка будет в группе курса. Первое занятие - уже в эту среду, 14 сентября!

Надеюсь, я вас заинтересовал, еще раз ссылка на курс.