Articles / Bookmarks / Profile of techus / Habr

Олег@techus^{read⁠-⁠only}

User

-0,5

Rating

Subscribers

ProfileComments4Bookmarks8

Durham Jun 30 2021 at 21:14

30 миллиардов параметров: реально ли обучить русский GPT-3 в «домашних» условиях?

17 min

36K

Algorithms * Machine learning * Artificial IntelligenceThe future is hereNatural Language Processing *

Technotext 2021

Не так давно Сбер, а затем и Яндекс объявили о создании сверхбольших русских языковых моделей, похожих на GPT-3. Они не только генерируют правдоподобный текст (статьи, песни, блоги и т. п.), но и решают много разнообразных задач, причем эти задачи зачастую можно ставить на русском языке без программирования и дополнительного обучения — нечто очень близкое к «универсальному» искусственному интеллекту. Но, как пишут авторы Сбера у себя в блоге, «подобные эксперименты доступны только компаниям, обладающим значительными вычислительными ресурсами». Обучение моделей с миллиардами параметров обходится в несколько десятков, а то сотен миллионов рублей. Получается, что индивидуальные разработчики и маленькие компании теперь исключены из процесса и могут теперь только использовать обученные кем-то модели. В статье я попробую оспорить этот тезис, рассказав о результатах попытки обучить модель с 30 миллиардами параметров на двух картах RTX 2080Ti.

+40

OmarovSayan Jun 22 2021 at 07:00

Помогите прочитать, что здесь написано? (OCR)

7 min

9.7K

Beeline Казахстан corporate blogProgramming * Image processing * Big Data * Machine learning *

Тонны архивных бумаг, чеков и счетов проходят сканирование и оцифровку во многих отраслях: в розничной торговле, логистике, банковских услугах и т.п. Компании получают конкурентное преимущество, если быстро оцифровывают и находят нужную информацию.

В 2020 году нам тоже пришлось решать проблему качественной оцифровки документов, и над этим проектом мы с коллегами работали совместно с компанией Verigram. Вот как мы проводили оцифровку документов на примере заказа клиентом SIM-карты прямо из дома.

Превращаем картинку в текст

+11

snakers4 Jun 21 2021 at 07:25

Сжимаем трансформеры: простые, универсальные и прикладные способы cделать их компактными и быстрыми

6 min

6.9K

Big Data * Natural Language Processing * Machine learning * Image processing *

Tutorial

transformer_press

Сейчас в сфере ML постоянно слышно про невероятные "успехи" трансформеров в разных областях. Но появляется все больше статей о том, что многие из этих успехов мягко говоря надуманы (из недавнего помню статью про пре-тренировку больших CNN в компьютерном зрении, огромную MLP сетку, статью про деконструкцию достижений в сфере трансформеров).

Если очень коротко просуммировать эти статьи — примерно все более менее эффективные нерекуррентные архитектуры на схожих вычислительных бюджетах, сценариях и данных будут показывать примерно похожие результаты.

Тем не менее у self-attention модуля есть ряд плюсов: (i) относительная простота при правильной реализации (ii) простота квантизации (iii) относительная эффективность на коротких (до нескольких сотен элементов) последовательностях и (iv) относительная популярность (но большая часть имплементаций имеет код раздутый раз в 5).

Также есть определенный пласт статей про улучшение именно асимптотических свойств self-attention модуля (например Linformer и его аналоги). Но несмотря на это, если например открыть список пре-тренированных языковых моделей на основе self-attention модулей, то окажется, что "эффективных" моделей там буквально пара штук и они были сделаны довольно давно. Да и последовательности длиннее 500 символов нужны не очень часто (если вы не Google).

Попробуем ответить на вопрос — а как существенно снизить размер и ускорить self-attention модуль и при этом еще удовлетворить ряду production-ready требований:

Читать дальше →

+19

dmitrii_ireshev May 24 2021 at 04:00

Гайд по сертификациям. Часть 1. Agile

7 min

22K

Development Management * Project management * Agile * Product Management * IT career

По Agile существует огромное количество курсов. Кроме специализированных курсов по проектному управлению есть ещё сертификации.

Зачем получать сертификаты по проектному управлению? Существуют несколько причин.

JuntaTalor Dec 10 2020 at 08:02

Ультимативный гайд по поиску утечек памяти в Python

7 min

40K

Домклик corporate blogPython * Programming *

Tutorial

Практика показывает, что в современном мире Docker-контейнеров и оркестраторов (Kubernetes, Nomad, etc) проблема с утечкой памяти может быть обнаружена не при локальной разработке, а в ходе нагрузочного тестирования, или даже в production-среде. В этой статье рассмотрим причины появления утечек в Python-приложениях, доступные инструменты для отладки и мониторинга работающего приложения, а также общую методику поиска утечек памяти.

+61

Aragroth May 12 2020 at 10:52

Внутри виртуальной машины Python. Часть 1

9 min

39K

Python * Learning languagesCompilers * Programming * Professional literature *

Translation

Введение

Примечание к переводу

В Python есть такое понятие, как «code object», которое (насколько я знаю) не встречается в других языках. Привожу определение этого термина, а подробности можно узнать в этой единственной статье на русском языке.

Читать дальше →

+25

Munrexio Sep 6 2019 at 20:48

Яндекс: умный дом по-взрослому

9 min

211K

JavaScript * Development for Linux * Smart HouseYandex API *

Tutorial

Недавно компания Яндекс запустила свою систему «умного дома». Нам предлагают купить недорогие работающие по Wi-Fi устройства: адаптер в розетку, лампочку и ИК пульт. Интересно, что у разработчиков «умных» устройств появилась возможность создать свои навыки «умного дома», это позволит подключить девайсы к системе Яндекса и управлять ими голосом через Алису. В списках навыков появляется всё больше новых брендов. Алиса прекрасно понимает русскую речь, что делает ее безусловным лидером среди голосовых ассистентов на российском рынке.
Однако, не всё так гладко…

Читать дальше →

+28

103

Syurmakov Jul 16 2019 at 21:32

Галерея лучших блокнотов по ML и Data Science

3 min

35K

Big Data * Data Mining * Python * Machine learning *

Привет, читатель.

Меня зовут Рушан, и я автор Telegram‑канала Нейрон. Не забудьте поделиться с коллегами или просто с теми, кому интересны такие статьи. Представляю пост который идёт строго (!) в закладки и передаётся коллегам. Он с подборкой примечательных файлов формата Jupyter Notebook по Machine Learning, Data Science и другим сферам, связанным с анализом данных. Эти блокноты Jupyter, будут наиболее полезны специалистам по анализу данных — как обучающимся новичкам, так и практикующим профи.

Итак, приступим.

Вводные курсы в Jupyter Notebook

Читать дальше →

+24

30 миллиардов параметров: реально ли обучить русский GPT-3 в «домашних» условиях?

Помогите прочитать, что здесь написано? (OCR)

Сжимаем трансформеры: простые, универсальные и прикладные способы cделать их компактными и быстрыми

Гайд по сертификациям. Часть 1. Agile

Ультимативный гайд по поиску утечек памяти в Python

Внутри виртуальной машины Python. Часть 1

Оглавление

Введение

Яндекс: умный дом по-взрослому

Галерея лучших блокнотов по ML и Data Science

Вводные курсы в Jupyter Notebook

Information