Pull to refresh
111.28
Open Data Science
Крупнейшее русскоязычное Data Science сообщество

Новый запуск курса Natural Language Processing

Reading time 2 min
Views 1.1K

TL;DR: Этой весной сообщество Open Data Science и компания Huawei делают новый запуск курса по обработке естественного языка. Вот страница нашего курса. Для того, чтобы его пройти, нужно зарегистрироваться.

Speech and Semantics
Speech and Semantics

Всем привет! Мы делаем новый запуск курса Natural Language Processing. Курс состоит из основных 10 занятий, посвященных разным ключевым темам NLP. Если кратко:

  • Закон Ципфа;

  • TF-IDF;

  • Word2Vec;

  • RNN;

  • CNN;

  • Transformer (про них будет подробно).

Это набор инструментов, но конечно мы рассмотрим и задачи - классификации текста, тэггирования (разметки последовательностей), генерации, включая и машинный перевод, и генерацию рассказов. Каждое занятие будет состоять из лекции и семинара. Полный syllabus курса можно посмотреть здесь.

В этот раз будут обновленные семинары, надеюсь, что они будут более полезными для освоения практических навыков работы с инструментами.

В прошлый раз ввели дополнительную тему применения методов NLP в задачах разработки программного обеспечения (NLP4Code, AI4SE). Наверняка все слышали про ChatGPT, частично мы разберемся, как это устроено (наверняка никто за пределами OpenAI не знает).

Также в курсе традиционно будет два задания, одно про Word2Vec, и еще одно в виде соревнования наподобие Kaggle. Помимо 10 основных занятий, будет еще две (или как получится) гостевых лекции, посвященные связанным с NLP темам от специалистов в этих темах. В прошлые запуски курса были лекции про обработку и генерацию речи, информационному поиску, графам знаний.

Лекции и семинары будут онлайн. После каждой лекции будет квиз. Сдача заданий и квизов будет происходить на платформе ODS. Самое важное, на мой взгляд, что большую часть курса составляет создание собственного проекта. Проект - это произведение одного или нескольких людей, которые делают одну программу, модель машинного обучения либо корпус текстов. Список проектов с прошлых запусков выложен вот тут. Актуальные проекты можно посмотреть в списке проектов ODS.

Пару слов о ведущих курса. Я буду читать лекции, в области NLP я работаю последние 10 лет, успел поработать в Яндексе и ВКонтакте, защитить кандидатскую диссертацию. Больше информации про меня здесь. Сам курс запускается в этом виде в пятый раз. В других инкарнациях он был уже около десятка раз, так что с одной стороны есть сообщество выпускников, с которыми можно кооперироваться для выполнения проектов, с другой многие (хотя, конечно, не все) острые углы удалось сгладить. Также в этом запуске мы сотрудничаем сразу с тремя вузами: МГТУ им. Баумана, ИТМО и ВШЭ. Если вы студент одного из этих вузов, то можно попробовать зачесть курс, как учебный.

В этом запуске все общение по курсу будет в группе в Telegram.

Лекции будут проходить по четвергам в 10:00 по Москве. Ссылки на занятия будут выкладываться в группе курса. Первое занятие - уже в следующий четверг, 9 февраля!

Если у вас не получается посещать лекции или семинары, не переживайте, записи и все материалы будут доступны на платформе курса. Надеюсь, я вас заинтересовал, так что еще раз ссылка на курс.

Tags:
Hubs:
+11
Comments 0
Comments Leave a comment

Other news

Information

Website
ods.ai
Registered
Founded
Employees
5,001–10,000 employees
Location
Россия