Python *

Высокоуровневый язык программирования

695,07

Рейтинг

СтатьиПостыНовостиАвторыКомпании

cyberauthor 7 янв 2021 в 15:13

Как экономить память и удваивать размеры моделей PyTorch с новым методом Sharded

5 мин

7.9K

Блог компании SkillfactoryBig Data * Python * Искусственный интеллектМашинное обучение *

Перевод

Модели глубокого обучения улучшаются с увеличением количества данных и параметров. Даже с последней моделью GPT-3 от Open AI, которая использует 175 миллиардов параметров, нам ещё предстоит увидеть плато роста количества параметров.

Для некоторых областей, таких как NLP, рабочей лошадкой был Transformer, который требует огромных объёмов памяти графического процессора. Реалистичные модели просто не помещаются в памяти. Последний метод под названием Sharded [букв. ‘сегментированный’] был представлен в Zero paper Microsoft, в котором они разработали метод, приближающий человечество к 1 триллиону параметров.

Специально к старту нового потока курса по Machine Learning, делюсь с вами статьей о Sharded в которой показывается, как использовать его с PyTorch сегодня для обучения моделей со вдвое большей памятью и всего за несколько минут. Эта возможность в PyTorch теперь доступна благодаря сотрудничеству между командами FairScale Facebook AI Research и PyTorch Lightning.

Приятного чтения!

+21

avdosev 6 янв 2021 в 18:52

Генерация дефолтных Github аватарок

2 мин

22K

GitHub * Python * Иконки *

Туториал

В данной статье я покажу и расскажу, как можно сгенерировать аватарки как на Github.

+25

cyberauthor 6 янв 2021 в 09:12

Визуализация пересечений и перекрытий с помощью Python

6 мин

15K

Блог компании SkillfactoryBig Data * Python * Визуализация данных * Открытые данные *

Перевод

Изучение вариантов решения одной из самых сложных задач визуализации данных

Преобладающая задача в любом анализе данных — сравнение нескольких наборов чего-либо. Это могут быть списки IP-адресов для каждой целевой страницы вашего сайта, клиенты, которые купили определённые товары в вашем магазине, несколько ответов из опроса и многое другое.

В этой статье воспользуемся Python для изучения способов визуализации перекрытий и пересечений множеств, наших возможностей, а также их преимуществ и недостатков.

Диаграмма Венна

Приятного чтения!

+24

spiral17 6 янв 2021 в 07:15

«Вспомнить все» или решение проблемы катастрофической забывчивости для чайников

29 мин

8.7K

TensorFlow * Искусственный интеллектМашинное обучение * Python *

Технотекст 2021

Эта моя статья будет посвящена проблеме катастрофической забывчивости и новейшим методам ее решения. Будут приведены примеры реализации этих методов, которые легко адаптировать под почти любую конфигурацию нейронной сети.

Сначала напомним, что это, собственно, за проблема. Если вдруг так оказалось, что вам нужно обучать нейронную сетку сначала на одном датасете, а затем на другом, то вы обнаружите, что по мере обучения на втором датасете сетка быстро забывает первый датасет, то есть теряет навык, полученный при обучении на нем. Или же если вы используете transfer learning и доучиваете готовую сетку на своих примерах, то будет наблюдаться тот же эффект – сетка успешно доучится на ваших данных, но при этом существенно утеряет предыдущие навыки, то есть то, ради чего весь transfer learning и затевался. Если вдруг датасетов, на которых надо последовательно учиться, не два а, к примеру, пять, то к концу обучения на пятом сетка забудет первый датасет практически полностью.

Вот с этим мы и будем бороться.

+11

Dirac 6 янв 2021 в 01:31

DALL·E от OpenAI: Генерация изображений из текста. Один из важнейших прорывов ИИ в начале 2021 года

5 мин

82K

Python * Программирование * Алгоритмы * Машинное обучение * Искусственный интеллект

Пару дней назад мы подводили ИИ итоги 2020-го года в мире машинного обучения. 2021-й год только начался, но мы определенно видим одну из важнейших работ в области ИИ текущего года.

Итак, исследователи в области искусственного интеллекта из OpenAI создали нейронную сеть под названием DALL·E, которая генерирует изображения из текстового описания на естественном языке.

Давайте посмотрим что из себя представляет, и на что способна эта нейронная сеть?

Поехали!

+27

122

maks00x 5 янв 2021 в 10:13

Как я научила свой компьютер играть в пары используя OpenCV и Глубокое обучение

7 мин

8.1K

Занимательные задачкиPython * Машинное обучение * Data Engineering *

Из песочницы

Перевод

Немного веселья с компьютерным зрением и CNN с маленькой базой данных.

+22

Dirac 31 дек 2020 в 20:25

ИИ итоги 2020-го года в мире машинного обучения

3 мин

11K

Python * Программирование * Алгоритмы * Машинное обучение * Искусственный интеллект

Подведем основные итоги уходящего года в мире машинного обучения. Рассмотрим самые громкие открытия в мире компьютерного зрения, обработки естественного языка, генерации изображений и видео, а также крупный прорыв в области биологии. Коротко о самом главном за год!

Поехали!

+15

rawoak 30 дек 2020 в 11:58

Вытаскиваем данные из Instagram

17 мин

149K

Python * Big Data * Открытые данные * Веб-аналитика *

Давайте разберемся, как с помощью достаточно простого кода на python можно вытащить из инстаграмма разные данные, находящиеся в открытом доступе.

+19

PatientZero 30 дек 2020 в 08:25

Создание процедурной анимации смерти при помощи автоматов падающего песка

2 мин

10K

Python * Разработка игр *

Перевод

В этом посте я покажу, как использовал автоматы падающего песка для генерации анимаций смерти монстров в моей игре Vagabond.

Автоматы падающего песка

Автомат падающего песка — это клеточный автомат, симулирующий перемещение песчинок и создание куч песка под действием гравитации.

Правила просты:

Если ячейка под песчинкой пуста, то песчинка движется в пустую ячейку (см. (a)).
Если ячейка под песчинкой заполнена, но свободна ячейка внизу слева или внизу справа, то песчинка движется туда (см. (b)). Если свободны обе, то одна из них выбирается случайным образом.
В остальных случаях песчинка не движется.

Читать дальше →

+62

DmitrySpb79 29 дек 2020 в 11:05

Принимаем и декодируем передачи SSTV с МКС

4 мин

34K

Python * Программирование * Системы связи * КосмонавтикаЛюбительская радиосвязь

Туториал

Привет, Хабр.

Как было написано в недавнем анонсе, с 24 по 31 декабря производится передача изображений формата SSTV с МКС. Передача идет в радиолюбительском диапазоне на частоте 145.800 МГц и принять её может любой желающий.

Посмотрим, как это работает и как такой сигнал можно принять и декодировать.

+22

cbmw 29 дек 2020 в 10:05

Rust глазами Python-разработчика #2

10 мин

7.3K

Блог компании Rambler&CoRust * Python *

Снова привет!

Мы – @cbmw и @AndreyErmilov, часть команды разработки «Рамблер/Медиа» (портал «Рамблер»). И это вторая часть наших размышлений по поводу сравнения Python и Rust (первая часть).
В этой части мы затронем многопоточность, асинхронность, функциональную парадигму и попробуем сделать некоторые заключения, которые мы для себя определили.

+17

DmitrySpb79 27 дек 2020 в 13:43

Декодируем сигнал метеоспутника NOAA в 50 строчек кода

5 мин

31K

Системы связи * Программирование * Научно-популярноеКосмонавтикаPython *

Привет, Хабр.

Продолжим тему декодирования различных видов радиосигналов. Одним из интересных форматов, разработанных еще в прошлом веке, является APT (Automatic Picture Transmission). Он используется для передачи изображений Земли из космоса, и что для нас гораздо более интересно и актуально, прием сигналов APT прост и доступен радиолюбителям.

Спутник NOAA © en.wikipedia.org/wiki/NOAA-15

Для тех, кому интересно, продолжение под катом.

Читать дальше →

+41

thedenk 27 дек 2020 в 13:04

Первое место на AI Journey 2020 Digital Петр

7 мин

8.9K

Обработка изображений * Машинное обучение * Искусственный интеллектPython * Natural Language Processing *

Из песочницы

Совсем недавно закончилось ежегодное международное соревнование AI Journey, организатором которого является Сбер. В этот раз нам была предоставлена возможность решать несколько задач: Digital Петр: распознавание рукописей Петра I, NoFloodWithAI: паводки на реке Амур и AI 4 Humanities: ruGPT-3. Наша команда приняла участие в решении задачи "Digital Петр: распознавание рукописей Петра I" и заняла первое место.

+13

artyomnaz 25 дек 2020 в 07:15

Как мы обучили нейросеть генерировать тени на фотографии

22 мин

12K

Python * Программирование * Обработка изображений * Машинное обучение * Искусственный интеллект

Туториал

Привет!

В этой статье поговорим о генеративно-состязательных сетях, о том, как научить нейросеть генерировать тени на изображении и какие хитрости можно применить для создания более правильных теней.

Ну что, погнали?

+24

EXL 25 дек 2020 в 01:09

Опыт сопряжения Java, JavaScript, Ruby и Python в одном проекте посредством GraalVM

18 мин

8.8K

Java * JavaScript * Oracle * Python * Ruby *

В прошлом месяце вышла стабильная LTS-версия многоязычной среды выполнения GraalVM 20.3.0 от корпорации Oracle и мне захотелось испробовать её для решения какой-нибудь интересной практической задачи. Для тех кто не в курсе, приведу краткое описание этой новой платформы. GraalVM позволяет использовать в едином окружении различные популярные языки программирования и обеспечивает их разностороннее взаимодействие в рамках некоторой общей среды выполнения.

Схематическое изображение архитектуры GraalVM из официальной документации.

Добавление новых языков в GraalVM осуществляется с помощью специального фреймворка Truffle, выполненного в виде библиотеки Java. Фреймворк предназначен для создания реализаций языков программирования в качестве интерпретаторов для самомодифицируемых абстрактных синтаксических деревьев (AST). При желании на его основе можно создать собственный язык, в официальных репозиториях GraalVM подробно рассмотрен пример реализации такого проекта под названием SimpleLanguage. Интерпретаторы, которые были написаны с использованием фреймворка Truffle, будут автоматически использовать GraalVM как JIT-компилятор непосредственно для самой реализации языка запускаемой на JVM-платформе и, соответственно, иметь возможность взаимодействия и двустороннего обмена данными в одном и том же пространстве памяти посредством специально разработанного протокола и программного интерфейса Polyglot API.

Платформа GraalVM вместе с исполняемой программой на смеси самых разных языков может быть представлена в виде автономного и самодостаточного исполняемого файла, либо работать поверх OpenJDK, Node.js или даже внутри Oracle Database.

Читать дальше →

+18

kesn 24 дек 2020 в 22:45

Я единственный из 1400, или самый крутой рекрутинг, что я проходил

9 мин

136K

Python * Управление разработкой * Управление проектами * Управление персоналом * Карьера в IT-индустрии

Я уже лет 10 пишу код на питоне, и последние 2.5 года стабильно работал на американскую компанию. Наверно, многим знакома история, когда ты кодишь-кодишь, вроде всё неплохо, и внезапно ты - самый знающий и опытный в команде и добро пожаловать в тим лиды. Астрологи объявили неделю менеджмента, количество кода снизилось на 100%.

Попробовав себя менеджером, я понял, что я дебил (как менеджер), и начал искать другую работу. Ребятушки, я офигел от того, насколько разный подход у компаний к найму. И мне кажется, я нашёл кое-что интересное, а если точнее - самый логичный и организованный процесс найма, что я видел.

Да что же там?

+72

316

Romfill 23 дек 2020 в 09:01

Как джуниор Python-разработчику стать мидлом за год

12 мин

35K

Блог компании Яндекс ПрактикумУчебный процесс в ITПрограммирование * Карьера в IT-индустрииPython *

Привет! Я Рома, менеджер продукта в Яндекс.Практикуме, где развиваю курс «Мидл Python-разработчик». Мы делаем из начинающих разработчиков крепких мидлов с инженерным мышлением. Сегодня хочу поделиться небольшими заметками о том, над чем стоит работать, если вы джуниор, который хочет стать мидлом.

Я не разработчик, поэтому эта статья во многом отражает взгляд со стороны. Ответить на вопрос «Как джуниор Python-разработчику стать мидлом за год?» — не такая простая задача, как может показаться на первый взгляд. Здесь спряталось сразу несколько челленджей:

Ответить на вопрос, кто такой джуниор: определить отправную точку, базу навыков, с которой мы будем рассматривать рост.
Ответить на вопрос, кто такой мидл — финальная точка нашего путешествия. Конечно же, во всех компаниях мидлы разные, а нам нужно какое-то взвешенное среднее, не оторванное от реальности.
Ответить на вопрос, почему рассматриваем рост именно за год. Не ради красивой круглой цифры же, верно?

Ну и это довольно холиварная тема. Не знаю, сколько копий было сломано на этом ристалище, но уж точно не одно.

Читать дальше →

+18

nerumb 22 дек 2020 в 14:32

Не баян: ищем дубликаты изображений на основе Milvus с индексом FAISS внутри

6 мин

9.8K

Kotlin * Python * Поисковые технологии * Разработка мобильных приложений *

В user-generated проектах часто приходится бороться с дубликатами, а для нас это особенно актуально, так как основной контент мобильного приложения, которое я разрабатываю, — это изображения, которые постятся десятками тысяч ежедневно. Для поиска повторов мы написали отдельную систему, чтобы облегчить процесс и сэкономить море времени.

Под катом рассмотрим используемые инструменты, а потом перейдём к примеру реализации.

Читать дальше →

+50

Picard 21 дек 2020 в 09:26

Как прогнозировать результаты спортивных матчей с помощью проекта ML на Python Pandas, Keras, Flask, Docker и Heroku

7 мин

13K

Блог компании SkillfactoryМашинное обучение * Лайфхаки для гиковPython *

Туториал

Перевод

Во время Чемпионата мира по регби в 2019 году я сделал небольшой научный проект Data Science, чтобы попытаться спрогнозировать результаты матчей, написав о нем здесь. Я развил проект до примера от начала до конца, чтобы продемонстрировать, как развернуть модель машинного обучения в виде интерактивного веб-приложения.

Приятного чтения

+18

AndreyErmilov 21 дек 2020 в 07:33

Rust глазами Python-разработчика

14 мин

29K

Блог компании Rambler&CoPython * Rust *

Привет! Мы – часть команды разработки «Рамблер/Медиа» (портал «Рамблер»). На протяжении трех лет мы поддерживаем и развиваем несколько больших python-приложений. Чуть больше года назад перед нами встала задача написать еще одно большое приложение – API к основному хранилищу новостей, и мы сделали это на Rust.

В статье мы расскажем о том, что заставило нас отойти от привычного стека технологий, и покажем, какие плюсы по сравнению с Python есть у Rust.

Мы не ответим на вопрос, почему выбор пал именно на Rust, а не Go, например, или на какой-либо другой язык. Также мы не будем сравнивать производительность Python- и Rust-приложений – эти темы достойны отдельного обсуждения.

+42

168

1 2 ...

121 122

123

124 125 ...

250 251