Статьи / Закладки / Профиль techus / Хабр

@techus^{read⁠-⁠only}

Пользователь

Подписчики

ПрофильПостыНовостиКомментарии4Закладки8

Durham 30 июн 2021 в 21:14

30 миллиардов параметров: реально ли обучить русский GPT-3 в «домашних» условиях?

17 мин

36K

Алгоритмы * Машинное обучение * Искусственный интеллектБудущее здесьNatural Language Processing *

Технотекст 2021

Не так давно Сбер, а затем и Яндекс объявили о создании сверхбольших русских языковых моделей, похожих на GPT-3. Они не только генерируют правдоподобный текст (статьи, песни, блоги и т. п.), но и решают много разнообразных задач, причем эти задачи зачастую можно ставить на русском языке без программирования и дополнительного обучения — нечто очень близкое к «универсальному» искусственному интеллекту. Но, как пишут авторы Сбера у себя в блоге, «подобные эксперименты доступны только компаниям, обладающим значительными вычислительными ресурсами». Обучение моделей с миллиардами параметров обходится в несколько десятков, а то сотен миллионов рублей. Получается, что индивидуальные разработчики и маленькие компании теперь исключены из процесса и могут теперь только использовать обученные кем-то модели. В статье я попробую оспорить этот тезис, рассказав о результатах попытки обучить модель с 30 миллиардами параметров на двух картах RTX 2080Ti.

+40

OmarovSayan 22 июн 2021 в 07:00

Помогите прочитать, что здесь написано? (OCR)

7 мин

9.8K

Блог компании Beeline КазахстанПрограммирование * Обработка изображений * Big Data * Машинное обучение *

Тонны архивных бумаг, чеков и счетов проходят сканирование и оцифровку во многих отраслях: в розничной торговле, логистике, банковских услугах и т.п. Компании получают конкурентное преимущество, если быстро оцифровывают и находят нужную информацию.

В 2020 году нам тоже пришлось решать проблему качественной оцифровки документов, и над этим проектом мы с коллегами работали совместно с компанией Verigram. Вот как мы проводили оцифровку документов на примере заказа клиентом SIM-карты прямо из дома.

Превращаем картинку в текст

+11

snakers4 21 июн 2021 в 07:25

Сжимаем трансформеры: простые, универсальные и прикладные способы cделать их компактными и быстрыми

6 мин

6.9K

Обработка изображений * Машинное обучение * Natural Language Processing * Big Data *

Туториал

transformer_press

Сейчас в сфере ML постоянно слышно про невероятные "успехи" трансформеров в разных областях. Но появляется все больше статей о том, что многие из этих успехов мягко говоря надуманы (из недавнего помню статью про пре-тренировку больших CNN в компьютерном зрении, огромную MLP сетку, статью про деконструкцию достижений в сфере трансформеров).

Если очень коротко просуммировать эти статьи — примерно все более менее эффективные нерекуррентные архитектуры на схожих вычислительных бюджетах, сценариях и данных будут показывать примерно похожие результаты.

Тем не менее у self-attention модуля есть ряд плюсов: (i) относительная простота при правильной реализации (ii) простота квантизации (iii) относительная эффективность на коротких (до нескольких сотен элементов) последовательностях и (iv) относительная популярность (но большая часть имплементаций имеет код раздутый раз в 5).

Также есть определенный пласт статей про улучшение именно асимптотических свойств self-attention модуля (например Linformer и его аналоги). Но несмотря на это, если например открыть список пре-тренированных языковых моделей на основе self-attention модулей, то окажется, что "эффективных" моделей там буквально пара штук и они были сделаны довольно давно. Да и последовательности длиннее 500 символов нужны не очень часто (если вы не Google).

Попробуем ответить на вопрос — а как существенно снизить размер и ускорить self-attention модуль и при этом еще удовлетворить ряду production-ready требований:

Читать дальше →

+19

dmitrii_ireshev 24 мая 2021 в 04:00

Гайд по сертификациям. Часть 1. Agile

7 мин

22K

Карьера в IT-индустрииУправление продуктом * Agile * Управление проектами * Управление разработкой *

По Agile существует огромное количество курсов. Кроме специализированных курсов по проектному управлению есть ещё сертификации.

Зачем получать сертификаты по проектному управлению? Существуют несколько причин.

JuntaTalor 10 дек 2020 в 08:02

Ультимативный гайд по поиску утечек памяти в Python

7 мин

41K

Блог компании ДомкликPython * Программирование *

Туториал

Практика показывает, что в современном мире Docker-контейнеров и оркестраторов (Kubernetes, Nomad, etc) проблема с утечкой памяти может быть обнаружена не при локальной разработке, а в ходе нагрузочного тестирования, или даже в production-среде. В этой статье рассмотрим причины появления утечек в Python-приложениях, доступные инструменты для отладки и мониторинга работающего приложения, а также общую методику поиска утечек памяти.

+61

Aragroth 12 мая 2020 в 10:52

Внутри виртуальной машины Python. Часть 1

9 мин

39K

Python * Изучение языковКомпиляторы * Программирование * Профессиональная литература *

Перевод

Введение

Примечание к переводу

В Python есть такое понятие, как «code object», которое (насколько я знаю) не встречается в других языках. Привожу определение этого термина, а подробности можно узнать в этой единственной статье на русском языке.

Читать дальше →

+28

Munrexio 6 сен 2019 в 20:48

Яндекс: умный дом по-взрослому

9 мин

212K

JavaScript * Linux * Умный домЯндекс API *

Туториал

Недавно компания Яндекс запустила свою систему «умного дома». Нам предлагают купить недорогие работающие по Wi-Fi устройства: адаптер в розетку, лампочку и ИК пульт. Интересно, что у разработчиков «умных» устройств появилась возможность создать свои навыки «умного дома», это позволит подключить девайсы к системе Яндекса и управлять ими голосом через Алису. В списках навыков появляется всё больше новых брендов. Алиса прекрасно понимает русскую речь, что делает ее безусловным лидером среди голосовых ассистентов на российском рынке.
Однако, не всё так гладко…

Читать дальше →

+31

103

Syurmakov 16 июл 2019 в 21:32

Галерея лучших блокнотов по ML и Data Science

3 мин

36K

Машинное обучение * Python * Data Mining * Big Data *

Привет, читатель.

Меня зовут Рушан, и я автор Telegram‑канала Нейрон. Не забудьте поделиться с коллегами или просто с теми, кому интересны такие статьи. Представляю пост который идёт строго (!) в закладки и передаётся коллегам. Он с подборкой примечательных файлов формата Jupyter Notebook по Machine Learning, Data Science и другим сферам, связанным с анализом данных. Эти блокноты Jupyter, будут наиболее полезны специалистам по анализу данных — как обучающимся новичкам, так и практикующим профи.

Итак, приступим.

Вводные курсы в Jupyter Notebook

Читать дальше →

+27

30 миллиардов параметров: реально ли обучить русский GPT-3 в «домашних» условиях?

Помогите прочитать, что здесь написано? (OCR)

Сжимаем трансформеры: простые, универсальные и прикладные способы cделать их компактными и быстрыми

Гайд по сертификациям. Часть 1. Agile

Ультимативный гайд по поиску утечек памяти в Python

Внутри виртуальной машины Python. Часть 1

Оглавление

Введение

Яндекс: умный дом по-взрослому

Галерея лучших блокнотов по ML и Data Science

Вводные курсы в Jupyter Notebook

Информация