Как стать автором
Обновить

Yandex Research открывает резиденцию по машинному обучению

Время на прочтение 2 мин
Количество просмотров 2K
Машинное обучение *IT-компании

Yandex Research открывает набор на программу ML Residency. Программа направлена на развитие научного сообщества в России. Yandex Research организует ML Residency совместно с МФТИ и ВШЭ. 

Yandex Research — это научный центр Яндекса, занимающийся фундаментальными проблемами в областях информатики (computer science) и искусственного интеллекта, таких как компьютерное зрение, Natural Language Processing, речевые технологии, краудсорсинг, поиск и рекомендации. На данный момент он лидирует среди российских технологических компаний по числу публикаций на NeurIPS, ICML, ICLR и других ведущих конференциях по машинному обучению. 

Читать далее
Всего голосов 15: ↑15 и ↓0 +15
Комментарии 0

Чем нам запомнится CVPR 2020. Как конференция про компьютерное зрение переехала в онлайн

Время на прочтение 10 мин
Количество просмотров 2.1K
Блог компании Яндекс Машинное обучение *Исследования и прогнозы в IT *Конференции Искусственный интеллект

Привет! Я Валентин Хрульков — исследователь из команды Yandex Research. Мы регулярно посещаем отраслевые конференции, а после делимся на Хабре впечатлениями: кто из докладчиков запомнился, какие стенды невозможно было обойти стороной, чьи постеры привлекли больше всего внимания. 2020 год внёс существенные коррективы в привычное расписание: многие события были отменены и перенесены, однако организаторы некоторых из них рискнули попробовать новые форматы.


CVPR 2020 — это 7600 участников, 5025 работ, событий и взаимодействий, 1,497,800 минут дискуссий — и всё онлайн. Больше подробностей — под катом.



Читать дальше →
Всего голосов 15: ↑15 и ↓0 +15
Комментарии 0

Яндекс открывает датасеты Беспилотных автомобилей, Погоды и Переводчика, чтобы помочь решить проблему сдвига данных в ML

Время на прочтение 6 мин
Количество просмотров 15K
Блог компании Яндекс Open source *Машинное обучение *Исследования и прогнозы в IT *Искусственный интеллект


В рамках конкурса Shifts Challenge мы выкладываем в открытый доступ крупнейший в мире датасет для обучения беспилотных автомобилей, а также данные Яндекс.Переводчика и Погоды. Приглашаем исследователей в области машинного обучения присоединиться к поиску решения проблемы сдвига распределения данных в реальном мире по отношению к тому, с чем моделям приходится иметь дело при обучении.

Меня зовут Андрей Малинин, я старший исследователь в Yandex Research. Сегодня я расскажу о проблеме, о наших датасетах, а также о конкурсе, который мы проводим в рамках международной конференции NeurIPS 2021 совместно с учеными из Оксфордского и Кембриджского университетов.

Всего голосов 48: ↑47 и ↓1 +46
Комментарии 7

DeDLOC: обучаем большие нейросети всем миром

Время на прочтение 7 мин
Количество просмотров 9.8K
Блог компании Яндекс Open source *Машинное обучение *Распределённые системы *Искусственный интеллект


Как показывает опыт последних лет, самые интересные результаты в deep learning получаются при использовании больших нейросетей, обученных на массивах неразмеченных данных. Правда, для создания этих моделей нужен суперкомпьютер с десятками или сотнями мощных видеокарт, а также быстрым соединением между серверами. Но что делать, если таких ресурсов нет, а в открытом доступе хорошей модели под вашу задачу не нашлось?

Сегодня я расскажу про технологию, которая позволяет учить нейросети, объединяя через интернет вычислительные мощности энтузиастов из любой точки мира. В её основе лежит совместная научная работа Yandex Research, Hugging Face, студентов ШАД, ВШЭ и МФТИ, а также профессора Университета Торонто. Технология уже получила боевое крещение в ходе реального эксперимента, подробно описанного ниже. В конце статьи вы узнаете, как поставить такой эксперимент самостоятельно — модель и код доступны всем желающим.

Претрейн для всех, и пусть никто не уйдёт обиженным


За последние несколько лет во многих областях deep learning (например, в обработке естественного языка) стала популярной идея self-supervised learning. Оказалось, что для получения полезных в целевой задаче представлений не нужна большая размеченная выборка. Достаточно обучить модель на какой-то простой сигнал, построенный из неразмеченных данных, которых чаще всего в достатке. В частности, известные многим архитектуры BERT, GPT и языковая модель YaLM обучаются именно так.
Читать дальше →
Всего голосов 36: ↑36 и ↓0 +36
Комментарии 4

Самая большая BERT-подобная модель на русском, которая поместится на ваш компьютер

Время на прочтение 7 мин
Количество просмотров 13K
Блог компании Яндекс Open source *Машинное обучение *Распределённые системы *Искусственный интеллект
✏️ Технотекст 2022
Привет, это снова Максим Рябинин, исследователь в Yandex Research. В прошлом году я рассказывал на Хабре о том, как вместе с Hugging Face, Университетом Торонто и волонтёрами мы обучили state-of-the-art модель для бенгальского языка и написали об этом статью на конференцию NeurIPS. Теперь хотим поделиться новым результатом: оказывается, технологии для обучения на нестабильном железе находят приложение и внутри привычных всем кластеров.

Используя вычислительную платформу Яндекса, мы обучили RuLeanALBERT — нейросеть, показывающую сравнимые с другими открытыми моделями и где-то даже близкие к state-of-the-art результаты на бенчмарках по пониманию русского языка — Russian SuperGLUE и RuCoLA. Наша модель хотя и имеет миллиарды параметров, но вполне способна вместиться в одну домашнюю GPU: вы можете использовать её в своих проектах для классификации предложений, представления текстов и других языковых задач, не требующих генерации. В статье можно прочитать о подробностях обучения, которые мы реализовали в открытом коде, а чекпоинт теперь тоже доступен всем желающим.


Примерно так выглядит процесс обучения на множестве независимых серверов
Читать дальше →
Всего голосов 52: ↑52 и ↓0 +52
Комментарии 8