TL;DR: Этой весной сообщество Open Data Science и компания Huawei делают новый запуск курса по обработке естественного языка. Вот страница нашего курса. Для того, чтобы его пройти, нужно зарегистрироваться.
![Speech and Semantics Speech and Semantics](https://habrastorage.org/getpro/habr/upload_files/4b6/3b2/951/4b63b29517b7cc37c169fa879631441a.png)
Всем привет! Мы делаем новый запуск курса Natural Language Processing. Курс состоит из основных 10 занятий, посвященных разным ключевым темам NLP. Если кратко:
Закон Ципфа;
TF-IDF;
Word2Vec;
RNN;
CNN;
Transformer (про них будет подробно).
Это набор инструментов, но конечно мы рассмотрим и задачи - классификации текста, тэггирования (разметки последовательностей), генерации, включая и машинный перевод, и генерацию рассказов. Каждое занятие будет состоять из лекции и семинара. Полный syllabus курса можно посмотреть здесь.
В этот раз будут обновленные семинары, надеюсь, что они будут более полезными для освоения практических навыков работы с инструментами.
В прошлый раз ввели дополнительную тему применения методов NLP в задачах разработки программного обеспечения (NLP4Code, AI4SE). Наверняка все слышали про ChatGPT, частично мы разберемся, как это устроено (наверняка никто за пределами OpenAI не знает).
Также в курсе традиционно будет два задания, одно про Word2Vec, и еще одно в виде соревнования наподобие Kaggle. Помимо 10 основных занятий, будет еще две (или как получится) гостевых лекции, посвященные связанным с NLP темам от специалистов в этих темах. В прошлые запуски курса были лекции про обработку и генерацию речи, информационному поиску, графам знаний.
Лекции и семинары будут онлайн. После каждой лекции будет квиз. Сдача заданий и квизов будет происходить на платформе ODS. Самое важное, на мой взгляд, что большую часть курса составляет создание собственного проекта. Проект - это произведение одного или нескольких людей, которые делают одну программу, модель машинного обучения либо корпус текстов. Список проектов с прошлых запусков выложен вот тут. Актуальные проекты можно посмотреть в списке проектов ODS.
Пару слов о ведущих курса. Я буду читать лекции, в области NLP я работаю последние 10 лет, успел поработать в Яндексе и ВКонтакте, защитить кандидатскую диссертацию. Больше информации про меня здесь. Сам курс запускается в этом виде в пятый раз. В других инкарнациях он был уже около десятка раз, так что с одной стороны есть сообщество выпускников, с которыми можно кооперироваться для выполнения проектов, с другой многие (хотя, конечно, не все) острые углы удалось сгладить. Также в этом запуске мы сотрудничаем сразу с тремя вузами: МГТУ им. Баумана, ИТМО и ВШЭ. Если вы студент одного из этих вузов, то можно попробовать зачесть курс, как учебный.
В этом запуске все общение по курсу будет в группе в Telegram.
Лекции будут проходить по четвергам в 10:00 по Москве. Ссылки на занятия будут выкладываться в группе курса. Первое занятие - уже в следующий четверг, 9 февраля!
Если у вас не получается посещать лекции или семинары, не переживайте, записи и все материалы будут доступны на платформе курса. Надеюсь, я вас заинтересовал, так что еще раз ссылка на курс.