Антон Дробышев @Dekakhrone

Руководитель проектов по машинному обучению

Профиль Статьи 1Посты Новости Комментарии 7

snakers4 21 июн 2021 в 10:25

Сжимаем трансформеры: простые, универсальные и прикладные способы cделать их компактными и быстрыми

6 мин

5.8K

Big Data*Natural Language Processing*Машинное обучение*Обработка изображений*

Туториал

transformer_press

Сейчас в сфере ML постоянно слышно про невероятные "успехи" трансформеров в разных областях. Но появляется все больше статей о том, что многие из этих успехов мягко говоря надуманы (из недавнего помню статью про пре-тренировку больших CNN в компьютерном зрении, огромную MLP сетку, статью про деконструкцию достижений в сфере трансформеров).

Если очень коротко просуммировать эти статьи — примерно все более менее эффективные нерекуррентные архитектуры на схожих вычислительных бюджетах, сценариях и данных будут показывать примерно похожие результаты.

Тем не менее у self-attention модуля есть ряд плюсов: (i) относительная простота при правильной реализации (ii) простота квантизации (iii) относительная эффективность на коротких (до нескольких сотен элементов) последовательностях и (iv) относительная популярность (но большая часть имплементаций имеет код раздутый раз в 5).

Также есть определенный пласт статей про улучшение именно асимптотических свойств self-attention модуля (например Linformer и его аналоги). Но несмотря на это, если например открыть список пре-тренированных языковых моделей на основе self-attention модулей, то окажется, что "эффективных" моделей там буквально пара штук и они были сделаны довольно давно. Да и последовательности длиннее 500 символов нужны не очень часто (если вы не Google).

Попробуем ответить на вопрос — а как существенно снизить размер и ускорить self-attention модуль и при этом еще удовлетворить ряду production-ready требований:

Читать дальше →

+19

tyomitch 4 окт 2019 в 12:05

Рисуем звук

3 мин

23K

JavaScript*WebAssembly*Алгоритмы*Визуализация данных*Звук

Пять лет назад на Хабре была опубликована статья «Печать и воспроизведение звука на бумаге» — о системе создания и проигрывания спектрограмм. Затем, полтора года назад Meklon опубликовал квест, в котором такая чёрно-белая логарифмическая спектрограмма стала одним из этапов. По авторскому замыслу, её надо было распечатать на принтере, отсканировать смартфоном с приложением-проигрывателем, и воспользоваться таким образом «надиктованным» паролем.

У меня в тот момент не было в досягаемости ни принтера, ни смартфона, так что меня заинтересовали два аспекта задачи:

Как проще всего расшифровать спектрограмму без дополнительных устройств и без дополнительного софта — желательно, прямо в браузере?
Можно ли её расшифровать вообще без софта — «на глаз»?

Читать дальше →

+25

host_m 3 мая 2021 в 13:20

Как превратить скрипт на Python в «настоящую» программу при помощи Docker

4 мин

71K

Блог компании VDSina.ruPython*Микросервисы*Программирование*

Перевод

Никого не интересует, умеете ли вы разворачивать связанный список — всем нужно, чтобы можно было легко запускать ваши программы на их машине. Это становится возможным благодаря Docker.

Для кого предназначена эта статья?

Вам когда-нибудь передавали код или программу, дерево зависимостей которой напоминает запутанную монтажную плату?

Как выглядит управление зависимостями

Без проблем, я уверен, что разработчик любезно предоставил вам скрипт установки, чтобы всё работало. Итак, вы запускаете его скрипт, и сразу же видите в оболочке кучу сообщений логов ошибок. «У меня на машине всё работало», — обычно так отвечает разработчик, когда вы обращаетесь к нему за помощью.

Docker решает эту проблему, обеспечивая почти тривиальную портируемость докеризованных приложений. В этой статье я расскажу, как быстро докеризировать ваши приложения на Python, чтобы ими можно было легко делиться с любым человеком, у которого есть Docker.

В частности, мы рассмотрим скрипты, которые должны работать как фоновый процесс.

Читать дальше →

+27

itsoft 17 мая 2021 в 07:00

Банки ультимативно лезут к нам в ш̶т̶а̶н̶ы̶ личную жизнь

5 мин

133K

Блог компании ITSOFTФинансы в ITЗаконодательство в ITРазработка под Android*Информационная безопасность*

Пару лет назад мы делали обзор премиальных банковских карт и обзор как экономить на страховках, если нет премиалки. А сейчас мы проанализировали порядка сотни приложений банков на права доступа, которые они требуют при установке их мобильного приложения на андроид. Результаты свели в таблицу.

Банковские приложения и сами банки ведут себя очень наглым образом. Уже при установке они запрашивают права доступа, которые им необязательны или совсем не нужны для работы. Например, приложение Сбербанка сразу требует доступ к звонкам и фоткам. Я категорически против. Отказываю. А приложение не хочет работать при таком раскладе.

+187

428

mors741 2 фев 2021 в 10:41

Квантование эмбеддингов: что это, зачем оно нужно и как его правильно готовить

8 мин

12K

Блог компании ЯндексBig Data*Высокая производительность*Машинное обучение*

Технотекст 2021

Привет, меня зовут Женя. Сегодня я расскажу, что такое квантование эмбеддингов, какие бывают способы квантования и как с их помощью мы в Яндекс.Дзене смогли сократить использование памяти, рейта записи и сетевого трафика в четыре раза. Будет совсем немного математики, умеренно размышлений о machine learning, highload и big data и много разноцветных картинок.

Что такое эмбеддинги?

Эмбеддинг — числовой вектор, который каким-то (в общем случае непонятным на глаз) образом характеризует интересы пользователя или контент. Например, эмбеддинги могут быть такими.

У каждого пользователя и карточки может быть несколько эмбеддингов разных типов. В основном используются два вида эмбеддингов.

Читать дальше →

+36

sterling239 25 мар 2021 в 10:01

Синтез речи виртуальных ассистентов Салют: как мы отошли от классических научных статей, чтобы сделать его человеческим

12 мин

20K

Блог компании SberDevicesМашинное обучение*Искусственный интеллектNatural Language Processing*

Автор исходного изображения: Blue Flourishes/Shutterstock.com

Всем привет! В этом посте мы расскажем про синтез голосов Сбера, Афины и Джой — виртуальных ассистентов семейства Салют. О том, как мы в SberDevices обучали модели, чтобы сделать синтез живым и специфичным для каждого персонажа, а также с какими проблемами столкнулись и как их решали.

Согласно нашей «библии ассистентов», Сбер — энергичный гик, Афина — взрослая и деловая, а Джой — дружелюбная и веселая. Они отличаются не только уникальными характерами, обращением на «ты»/«вы» и предпочтениями в шутках. Мы попытались сделать так, чтобы их личности отражались и в голосах, которыми они разговаривают. 

Персонажей озвучили телеведущая Анастасия Чернобровина (Афина) и актёры дубляжа Даниил Щебланов и Татьяна Ермилова (Сбер и Джой). Виртуальных ассистентов можно услышать в приложениях Сбер Салют, СберБанк Онлайн, нашем колл-центре по номеру 900, а также в устройствах SberBox и SberPortal. Всё, что вы услышите, — это синтез речи, реализованный с помощью нейросетей. Он работает на связке Tacotron 2 и LPCNet.

Но, чтобы было понятно, что, зачем и почему, — немного теории и истории

+45

Serine 3 фев 2021 в 09:27

Человейник, тебе меня не сломить! Анализ жилья в мегаполисе

13 мин

107K

ЗдоровьеГеоинформационные сервисы*

Технотекст 2021

Вчера на них никто не обращал внимание, а сегодня они повсюду. Человейники атакуют! Официально они именуются ЖК эконом-класса, а по сути являются гигантскими бетонными коробками из дешевых материалов. Москва задает моду на уплотнительную застройку и возведение целых районов человейников. И вот уже из Питера, Новосибирска и других зон поражения раздается безысходное «понастроили тут». Как всегда, под ударом простой народ. В красной зоне риска — люди, созревшие для покупки или аренды квартир.

Что противопоставить диктату неконтролируемой застройки? Нужен открытый и удобный инструмент для анализа качества городской среды, отдельно взятых районов и домов. Под прицелом — не только плотность застройки, но и экология, уровень шума, доступность инфраструктуры и другие факторы, формирующие качество жизни в мегаполисе.

Человейники Гонконга. Интересно, можно ли будет сделать такую фотку в Москве лет через 30?

Читать дальше →

+152

766

Leono 11 мар 2018 в 15:37

Эффективные методы сжатия данных при тренировке нейросетей. Лекция в Яндексе

33 мин

13K

Блог компании ЯндексСжатие данных*Машинное обучение*

Не так давно в Яндекс приезжал Геннадий Пехименко — профессор Университета Торонто и PhD Университета Карнеги-Меллон. Он прочитал лекцию об алгоритмах кодирования, которые позволяют обходить проблему ограничения памяти GPU при обучении глубоких нейронных сетей.

— Я вхожу в несколько групп Университета Торонто. Одна из них — Computer Systems and Networking Group. Есть еще моя собственная группа — EcoSystem Group. Как видно из названий групп, я не специалист непосредственно в машинном обучении. Но нейронные сети сейчас достаточно популярны, и людям, которые занимаются компьютерной архитектурой и сетями, компьютерными системами, приходится сталкиваться с этими приложениями на постоянной основе. Поэтому последние полтора-два года этой темой я тоже плотно занимаюсь.

+41

aigame 17 ноя 2020 в 05:11

Сверхэффективная нейронная сеть или гиперсеть

20 мин

16K

Искусственный интеллектМозг

Что нужно чтобы создать искусственный интеллект? По какому пути идти до этой цели? Многие с уверенностью ответят, что научное сообщество уже полным ходом движется на этом пути. Что со следующими нейросетевыми моделями с еще большим количеством параметров, с еще более мощными нейроморфными компьютерами, и еще более масштабными датасетами на все случаи жизни, мы ворвёмся в эпоху мыслящих машин. На мой взгляд, это похоже на гонку за морковкой и скорее очевидным для всех такое положение дел станет тогда когда количество настраиваемых параметров в моделях, станет больше чем связей в человеческом мозгу, но ожидаемого эффекта не будет достигнуто.
В этой статья я обозначу путь выхода из порочного бега за морковкой, и расскажу о своём пути и наработках в своих исследованиях.

+18

EShumilov 24 мая 2017 в 20:43

Статья, на которую можно ссылаться: что такое блокчейн

9 мин

82K

Блог компании EmercoinЧитальный залИсследования и прогнозы в IT*

В 2017 году блокчейн стал предметом научного интереса, когда в Торонто открылся первый институт исследований блокчейна. Около 30 ведущих экспертов приступили к разработке различных проектов, связанных с этой технологией.

Блокчейн — это надёжный способ хранения данных о сделках, контрактах, транзакциях, обо всём, что необходимо записать и проверить. Сегодня блокчейн проник практически во все сферы жизнедеятельности, готов в корне изменить финансовую систему государства и в разы упростить работу среднего и крупного бизнеса. Блокчейн не секретная технология: в сети огромное количество статей о том, как он устроен и по какому принципу работает. Мы собрали самые интересные и нужные факты в одну статью, на которую можно давать ссылку, когда вас спросят: «Что же такое блокчейн?»

Читать дальше →

+38

skillfactory_school 19 ноя 2020 в 17:03

57 отборных репозиториев для всех разработчиков Python

8 мин

27K

Блог компании SkillfactoryПрограммирование*Лайфхаки для гиковPython*GitHub*

Перевод

Специально к старту нового потока курса «Python для веб-разработки» представляем подборку из 57 репозиториев, которые будут полезны как начинающему, так и опытному разработчику: это репозитории с ответами на вопросы собеседований, репозитории с книгами, небольшие, но полезные консольные инструменты и проекты, которые вдохновят вас написать красивый, работающий и полезный код.

Приятного чтения!

+16

Bernodot 24 июл 2018 в 18:47

Как я не уехал в США и стал Президентом в России

13 мин

58K

Блог компании Puzzle EnglishИзучение языковКарьера в IT-индустрииРазвитие стартапа

В этом лонгриде я рассказываю как от безработного дорасти до президента. Запаситесь терпением и чувством юмора!

Как я стал безработным

В 2007-м мои рабочие будни проходили в большом “курятнике” в центре Москвы. В роли курочек выступали менеджеры, высиживающие свои проекты, на отведенной каждому площади в полтора квадратных метра на территории общего оупен-спейса. Контора носила очень гордое название, что-то в стиле Super Mega World Media Ventures. Ой, да именно такое и носила, только без Super Mega.

Бизнес-идея мирового венчура заключалась в том, чтобы “понабрать по объявлению” как можно больше менеджеров со всяческими идеями и пусть они стартапят свои проекты кто во что горазд. Авось парочка из них станет новыми фейсбуками — теория больших чисел в действии.

Читать дальше →

+58

422

yorko 27 янв 2016 в 00:25

Python и красивые ножки: как я бы знакомил сына с математикой и программированием

4 мин

109K

Программирование*Python*Математика*Занимательные задачки

Раньше мы уже искали необычные модели Playboy с помощью библиотеки Python Scikit-learn. Теперь мы продемонстрируем некоторые возможности библиотек SymPy, SciPy, Matplotlib и Pandas на живом примере из разряда занимательных школьных задач по математике. Цель — облегчить порог вхождения при изучении Python библиотек для анализа данных.

Читать дальше →

+50

Artgor 25 авг 2017 в 14:04

Как сделать проект по распознаванию рукописных цифр с дообучением онлайн. Гайд для не совсем начинающих

57 мин

35K

Блог компании Open Data ScienceData Mining*Python*Машинное обучение*Обработка изображений*

Туториал

Привет, Хабр! В последнее время машинное обучение и data science в целом приобретают все большую популярность. Постоянно появляются новые библиотеки и для тренировки моделей машинного обучения может потребоваться совсем немного кода. В такой ситуации можно забыть, что машинное обучение — не самоцель, а инструмент для решения какой-либо задачи. Мало сделать работающую модель, не менее важно качественно презентовать результаты анализа или сделать работающий продукт.

Я хотел бы рассказать о том, как создал проект по распознаванию рукописного ввода цифр с моделями, которые дообучаются на нарисованных пользователями цифрах. Используется две модели: простая нейронная сеть (FNN) на чистом numpy и сверточная сеть (CNN) на Tensorflow. Вы сможете узнать, как сделать практически с нуля следующее:

создать простой сайт с использованием Flask и Bootstrap;
разместить его на платформе Heroku;
реализовать сохранение и загрузку данных с помощью облака Amazon s3;
собрать собственный датасет;
натренировать модели машинного обучения (FNN и CNN);
сделать возможность дообучения этих моделей;
сделать сайт, который сможет распознавать нарисованные изображения;

Для полного понимания проекта желательно знать как работает deep learning для распознавания изображений, иметь базовые знания о Flask и немного разбираться в HTML, JS и CSS.

Читать дальше →

+25

Nkvlk 1 авг 2018 в 09:32

Наиболее востребованные языки программирования – 2018

3 мин

199K

Блог компании hh.ruСтатистика в ITКарьера в IT-индустрииИсследования и прогнозы в IT*

Очередная статистика от hh.ru под катом. Вкратце — очень хотелось посчитать, на каких языках чаще всего пишут отечественные разработчики и какие языки чаще других ищут работодатели. Итого — посчитал, что указывали в вакансиях и в резюме в первом полугодии 2018 и 2017 годов. Получилось что получилось.

Читать дальше →

+62

EdT 21 сен 2017 в 17:28

Достижения в глубоком обучении за последний год

13 мин

88K

Блог компании VKBig Data*Алгоритмы*Машинное обучение*

Привет, Хабр. В своей статье я расскажу вам, что интересного произошло в мире машинного обучения за последний год (в основном в Deep Learning). А произошло очень многое, поэтому я остановился на самых, на мой взгляд, зрелищных и/или значимых достижениях. Технические аспекты улучшения архитектур сетей в статье не приводятся. Расширяем кругозор!

+96

LeoMat 20 мар 2011 в 19:46

Регулярные выражения, пособие для новичков. Часть 2

18 мин

262K

Python*

Перевод

В первой половине этого пособия мы раскрыли лишь малую часть возможностей регулярных выражений. Во второй, большей, половине мы рассмотрим некоторые новые метасимволы, то, как использовать группы для получения частей совпавшего текста, разбивать строки, находить и замещать части текста. В конце немного поговорим о распространенных ошибках.

Читать дальше →

+65

xopxe 26 окт 2016 в 19:44

[ В закладки ] Зоопарк архитектур нейронных сетей. Часть 1

10 мин

95K

Блог компании Wunder FundАлгоритмы*Машинное обучение*

Перевод

Это первая часть, вот вторая.
За всеми архитектурами нейронных сетей, которые то и дело возникают последнее время, уследить непросто. Даже понимание всех аббревиатур, которыми бросаются профессионалы, поначалу может показаться невыполнимой задачей.

Поэтому я решил составить шпаргалку по таким архитектурам. Большинство из них — нейронные сети, но некоторые — звери иной породы. Хотя все эти архитектуры подаются как новейшие и уникальные, когда я изобразил их структуру, внутренние связи стали намного понятнее.

Читать дальше →

+49

KTarachev 30 июн 2010 в 13:26

Зачем работать в ABBYY? Часть первая

4 мин

27K

Блог компании Content AI

Первая часть обещанного в моём предыдущем посте развёрнутого ответа. Вторая последует чуть позже (update: вторую читайте здесь).

Итак, поехали. Зачем? Затем, что здесь совсем не скучно. Это кроме всего прочего. Когда работа жить не мешает, а наоборот вносит в неё очень приятное разнообразие, то и обременительной совсем не кажется. Попытаюсь раскрыть это утверждение и просто расскажу, что у нас происходит. Глядишь, и люди к нам потянутся.

Пришедшим к нам гарантируется ~~тёплая одежда и горячая пища~~ практически свободный график работы, спортзал в офисе, неплохой фитнес в 5 минутах пешком от офиса, возможность изучать английский язык с носителем, вполне приличные зарплаты (да-да, в этом посте тоже про них только вскользь) и прочие мелкие радости жизни, как и во всех нормальных компаниях.

Но, конечно, не только эти штуки мешают нам скучать.

Читаем дальше.

+23

siberiano 23 мар 2012 в 17:33

Перестаньте писать классы

9 мин

187K

Python*Проектирование и рефакторинг*

Признак того, что объект не должен быть классом — если в нём всего 2 метода, и один из них — инициализация, __init__. Каждый раз видя это, подумайте: «наверное, мне нужна просто одна функция».

Каждый раз когда из написанного класса вы создаёте всего один экземпляр, используете только раз и тут же выбрасываете, следует думать: «ой, надо бы это отрефакторить! Можно сделать проще, намного проще!»

Перевод доклада Джэка Дидриха, одного из ключевых разработчиков языка Питон. Доклад прозвучал 9 марта 2012 на конференции PyCon US.

Читать дальше →

+178

148

1 2 ...

6 7

Сжимаем трансформеры: простые, универсальные и прикладные способы cделать их компактными и быстрыми

Рисуем звук

Как превратить скрипт на Python в «настоящую» программу при помощи Docker

Для кого предназначена эта статья?

Банки ультимативно лезут к нам в ш̶т̶а̶н̶ы̶ личную жизнь

Квантование эмбеддингов: что это, зачем оно нужно и как его правильно готовить

Что такое эмбеддинги?

Синтез речи виртуальных ассистентов Салют: как мы отошли от классических научных статей, чтобы сделать его человеческим

Человейник, тебе меня не сломить! Анализ жилья в мегаполисе

Эффективные методы сжатия данных при тренировке нейросетей. Лекция в Яндексе

Сверхэффективная нейронная сеть или гиперсеть

Статья, на которую можно ссылаться: что такое блокчейн

57 отборных репозиториев для всех разработчиков Python

Как я не уехал в США и стал Президентом в России

Как я стал безработным

Python и красивые ножки: как я бы знакомил сына с математикой и программированием

Как сделать проект по распознаванию рукописных цифр с дообучением онлайн. Гайд для не совсем начинающих

Наиболее востребованные языки программирования – 2018

Достижения в глубоком обучении за последний год

Регулярные выражения, пособие для новичков. Часть 2

[ В закладки ] Зоопарк архитектур нейронных сетей. Часть 1

Зачем работать в ABBYY? Часть первая

Перестаньте писать классы

Информация

Специализация