Pull to refresh
75
0
Валентин Малых @madrugado

AI / NLP Researcher

Send message

перезагрузите страницу, пожалуйста

сейчас нужно использовать pymorphy3, т.к. pymorphy2 не развивается

спасибо, поправил

нет, такое глубокое погружение - это уже тема других книг, или скорее даже статей, книг на эту тему я не знаю

спасибо вам за вопросы

NLP - natural language processing, обработка естественного языка; по-русски еще принято говорить анализ текстов. Это не совсем точно, т.к. помимо анализа NLP включает в себя и генерацию текстов. Для примера, всем известная OpenAI ChatGPT - это как раз генеративная языковая модель. Если хотите подробнее про это узнать, приходите на мой курс.

MTS AI - это центр искусственного интеллекта компании МТС. Мы занимаемся созданием технологий и продуктов на базе ИИ для МТС и внешних заказчиков.

у всех свои представления о простых и сложных вещах, если вы более подробно сформулируете, что в первых 4 лекциях объяснено недостаточно хорошо, я буду вам благодарен

в посте дана правильная ссылка: https://t.me/+AciH2MVMv_RiMGQy

на сайте поправим

записи уже есть, можно смотреть их, суть курса не в прослушивании лекций, как таковых, лекции - это способ помочь вам разобраться с инструментами и основными задачами; а свои знания вы сможете применить в проекте - вот для проектов надо участвовать в обсуждениях, задавать вопросы (ну и слушать лекции тоже)

в курсе два домашних задания: 1 - оно, вероятно, будет делаться на numpy, но мы посмотрим, как это устроить;
2 - можно делать на чем угодно, это дз в формате соревнования

помимо этого есть еще ваш личный проект - его также можно делать на чем угодно

в канале есть информация, вот прямой линк на курс, нужно нажать "join": https://ods.ai/tracks/nlp-course

fast align — отличная штука, но он был сделан в 2013 году, а IBM Models — это на 20 лет раньше
стоит начать с того, что я не являюсь специалистом по машинному переводу непосредственно, я им занимался существенно меньше, чем другими задачами обработки естественного языка; но да, я приверженец статистического подхода, на мой взгляд использование словарей и сложных автоматов для словоизменения — это излишне, все может быть реализовано статистически; само собой не претендую на абсолютную истину, но в данный момент развитие области идет в направлении статистического обучения

к слову, в нашем курсе мы стараемся дать полную картину и те подходы, которые вы упоминаете, там тоже описываются
есть канал в слаке ODS: #huawei_nlp_course

если вам не пришло приглашение на платформу курса, и вы были зарегистрированы, то напишите мне в личные сообщения свою почту, я вас добавлю
вот запись трансляции первой лекции www.youtube.com/watch?v=qUmmrypcqIU
на канале выложена уже и запись второй лекции
они будут доступны на платформе курса. также удалось договориться о записи лекций, они также будут доступны на платформе курса
вам повезло, удалось договориться, чтобы были записи лекций, выложим их на платформу курса

для первой лекции обещают даже сделать трансляцию
да, этот курс есть, но этот курс больше посвящен глубокому обучению, насколько я могу судить, в тоже время наш курс в основном про саму обработку естественного языка
там довольно много чего происходит, насколько я могу судить по общению с коллегами, но у них вроде бы не было в плане запуска курса
смотря что вы хотите получить, если базовое представление, то есть web.stanford.edu/~jurafsky/slp3
если какие-то прямо свежие вещи, то просто идите на arxiv, там много свежих статей по тематике машинного перевода, может быть, стоит начать с каких-то обзорных статей, чтобы понимать общие тренды

Information

Rating
Does not participate
Location
Москва и Московская обл., Россия
Works in
Registered
Activity