Все потоки

Python *

Высокоуровневый язык программирования

667,58

Рейтинг

СтатьиПостыНовостиАвторыКомпании

MrNightSky 29 сен 2021 в 09:00

Дообучаем готовую нейросеть для классификации данных

12 мин

14K

Блог компании FUNCORPPython * Обработка изображений * Машинное обучение * Data Engineering *

В прошлой статье мы научились классифицировать данные без разметки с помощью понижения размерности и методов кластеризации. По итогам получили первичную разметку данных и узнали, что это картинки. С такими начальными условиями можно придумать что-то более серьёзное, например, дообучить существующую нейросеть на наши классы, даже если до этого она их никогда не видела. В iFunny на первом уровне модерации мы выделяем три основных класса:

• approved — картинки идут в раздел collective (развлекательный контент и мемы);
• not suitable — не попадают в общую ленту, но остаются в ленте пользователя (селфи, пейзажи и другие);
• risked — получают бан и удаляются из приложения (расизм, порнография, расчленёнка и всё, что попадает под определение «противоправный контент»).

Сегодня расскажу на наглядных примерах, как мы перестраивали модель под наши классы, обучали её и выделяли паттерны распознавания картинок. Технические подробности — под катом.

Читать далее

+47

Arsem 28 сен 2021 в 18:48

Интересное применение WordCloud

4 мин

11K

Из песочницы

Использование WordCloud для создания облака слов из переписки.

Читать далее

+13

PythonAnalyst 28 сен 2021 в 10:55

Мегаанализ распространения Covid-19 в Москве

4 мин

4.8K

Python * Big Data * Визуализация данных * ЗдоровьеМашинное обучение *

Из песочницы

В этой части целого цикла статей я представлю только статистические данные. В последующих главах будет выполнено предсказание тяжести заболевания, влияния загрязнения воздуха и даже сделано фундаментальное открытие, обобщающее закон Гомперца на различные тяжести течения Covid- 19.

Читать далее

+14

krisstinkou 24 сен 2021 в 16:45

Работаем с текстами на Python: кодировки, нормализация, чистка

9 мин

121K

Python * Data Engineering *

Из песочницы

Об обработке текстов на естественном языке сейчас знают все. Все хоть раз пробовали задавать вопрос Сири или Алисе, пользовались Grammarly (это не реклама), пробовали генераторы стихов, текстов... или просто вводили запрос в Google. Да, вот так просто. На самом деле Google понимаетот него хотите, благодаря ш, что вы тукам, которые умеют обрабатывать и анализировать естественную речь в вашем запросе.

При анализе текста мы можем столкнуться с ситуациями, когда текст содержит специфические символы, которые необходимо проанализировать наравне с "простым текстом" или формулы, например. В таком случае обработка текста может усложниться.

Вы можете заметить, что если ввести в поисковую строку запрос с символами с ударением (так называемый модифицирующий акут), к примеру "ó", поисковая система может показать результаты, содержащие слова из вашего запроса, символы с ударением уже выглядят как обычные символы.

Так как всё-таки происходит обработка таких запросов?

Читать далее

+22

TatianaLi 24 сен 2021 в 14:14

Геоаналитика с помощью Python и открытых данных: пошаговое руководство

11 мин

59K

Python * OpenStreetMap * Геоинформационные сервисы * Открытые данные * Визуализация данных *

Из песочницы

Геоаналитика с помощью Python: GeoPandas, folium, Uber H3, OSM + примеры как можно определять лучшие локации для поиска помещений под открытие кофейни (и не только).

Читать далее

+29

Konstantin_rnd 23 сен 2021 в 09:14

Как я написал свой ChatOps: опыт выпускника курса по Python

5 мин

11K

Блог компании СлёрмPython * Программирование * DevOps * Kubernetes *

DevOps-инженер Константин Кулишов рассказал, как создал свой ChatOps, чтобы дать разработчикам возможность вносить изменения в проект в любое время. Константин выложил ChatOps на GitHub и подробно описал процесс создания.

Читать статью

+11

shurik2533 22 сен 2021 в 21:26

Моя клубничная чудо-коробка

17 мин

69K

Python * Raspberry Pi * ГаджетыDIY или Сделай самБиология

Я собрал умную коробку для круглогодичного выращивания клубники у себя на балконе. Расскажу как сделал управление освещением, поливом, отоплением, какие датчики использовал, с какими проблемами столкнулся и покажу результат.

Читать далее

+170

dirijabla 22 сен 2021 в 20:30

Объем, центр масс, моменты инерции тела, имея только mesh поверхности

7 мин

6.7K

Python * CAD/CAM * Математика *

Для начала нужно обзавестись этим самым "mesh"-ем поверхности, или триангуляцией поверхности, полигональной сеткой, разбиением двумерного многообразия. В данном случае работа будет вестись именно с треугольной сеткой, но все ниже представленные формулы и код (если немного модифицировать), будет работать с сеткой состоящей из любых полигонов. Главное, чтобы они были малые, от этого зависит точность, чем меньше - тем лучше.

Читать далее

+21

mohovkm 21 сен 2021 в 12:30

Создаём анимационные обучающие видео на Python с помощью Manim

33 мин

18K

Блог компании Яндекс ПрактикумPython * Компьютерная анимация * Работа с видео *

Туториал

Привет! Меня зовут Константин Мохов, я тимлид, который однажды прошёл курс Практикума по аналитике данных, по большей части для собственного развития. Тема создания анимированных видео на Python заинтересовала меня позже, когда в телеграм-канале Алексея Макарова из Практикума появилось сообщение, что его команде нужна помощь с анимацией. Мне захотелось попробовать создать интересное и наглядное обучающее видео, раскрывающее одну из тем курса, например, гистограммы.

Я углубился в изучение вопроса и перечитал немало статей на тему создания анимации «как у 3Blue1Brown», которые в основном были либо переводами, либо копией оригинального туториала Гранта Сандерсона. Грант создал и выложил в открытый доступ специальную библиотеку на Python — Manim, которая предназначена для создания анимации. В роликах, запрограммированных с помощью Manim, он объясняет математические темы на своём YouTube-канале.

В этой статье я поделюсь личным опытом: рецептом создания объектов и анимаций. Вместе мы создадим обучающее видео о гистограммах. Вот как будет выглядеть итоговый вариант:

А теперь поехали!

+12

RadST 20 сен 2021 в 21:18

Фреймворки для тестирования: личный опыт и новые методы

12 мин

29K

Python * Тестирование IT-систем * Тестирование веб-сервисов * Тестирование игр * Тестирование мобильных приложений *

Из песочницы

Привет, Хабр! Меня зовут Сергей Радченко, и мы с командой профессионально занимаемся тестированием уже несколько лет. Сегодня я посчитал количество автотестов, которые мы подготовили для веб-интерфейсов, десктопных приложений, API, систем двухфакторной авторизации и так далее (их оказалось более 5000). И мне захотелось рассказать о нашем опыте создания экосистемы для автоматизированного тестирования. В этом посте вы найдете описание полезных для комплексного тестирования фреймворков, а также исходный код некоторых дополнительных методов, которые мы дописали самостоятельно, чтобы написание тестов происходило быстрее, и тестирование приносило больше пользы.

Читать далее

+15

krasnov_v_i 20 сен 2021 в 11:00

Python микросервисы с Kafka без боли

10 мин

38K

Python * Проектирование API * Data Engineering *

Из песочницы

В этой статье я бы хотел поделиться способом написания асинхронных микросервисов на Python, в основе которых библиотека Faust. А в качестве брокера сообщений Kafka. Ну и немного мониторинга с Prometheus и Grafana.

Читать далее

+23

daniilgorbenko 20 сен 2021 в 06:00

Подборка полезных библиотек для Python с примерами #1

9 мин

22K

Python * Программирование *

У Python одно из самых больших комьюнити. Этот язык любят за его простоту, лояльность и за его универсальность, которая была достигнута созданием огромного числа библиотек и фреймворков, таких как numpy, django, flask, pygame, tornado, tensorflow и других. На сайте pypi содержится более 320 тысяч проектов от малоизвестных и заброшенных до огромных, которыми пользуются миллионы людей в различных сферах.

Однако даже в таком большом числе библиотек иногда бывает трудно найти нужную. Поэтому хотелось бы поделиться некоторыми полезными библиотеками и привести примеры работы с ними.

Ознакомиться

+13

fafnir999 17 сен 2021 в 10:28

Как определить самый авторитетный фильм всех времен и народов

31 мин

6.1K

Python * Data Mining *

Из песочницы

Какое произведение киноискусства оставило самый большой отпечаток в современной поп культуре? Предлагаю подумать над этим вопросом некоторое время. Может быть это Апокалипсис сегодня? Или Крестный отец? А вдруг главный фильм всех времен и народов это шедевр отечественного кинематографа - фильм Викинг?

К счастью, это можно посчитать.

Читать далее

+21

nagadit 16 сен 2021 в 10:15

Involution: Attention is not what you need, или Как скрестить Self-Attention из NLP и Convolution в задачах CV

5 мин

8.1K

Машинное обучение * Алгоритмы * Python *

Из песочницы

Если говорить про Self-Attention в картиночных моделях, то тут есть 2 варианта. Олдскульный “давайте просто перевзвесим фичи” в разных вариантах: поканально, пространственно, в некоторой проекции. И новомодный "давайте обучим трансформер" с представлением патчей как визуальных слов. Первый подход рабочий, но не дает значительного улучшения в плане метрик. Второй подход слишком вычислительно сложный и часто заточен на размер картинок.

Подход коллег из ByteDance AI Lab и университета Пекина сильно отличается от этих крайностей и является переосмыслением Attention-механизма трансформеров в работе свёрток.

Читать подробнее об Involution

+13

qwertyforce 16 сен 2021 в 09:41

Фотогалерея на максималках

20 мин

12K

Python * JavaScript * Обработка изображений * Машинное обучение * Искусственный интеллект

~1 год назад я начал разрабатывать свою фотогалерею (~~песочницу для теста всяких технологий~~). Данная статья – это описание её архитектуры, а также различные твики/лайфхаки/микрогайды которые я узнал за время разработки + немного про производительность.

Читать далее

+22

hatman 16 сен 2021 в 02:39

Сколько на самом деле вакансий на Python в веб-разработке (на примере Москвы)

3 мин

21K

Python * Карьера в IT-индустрии

В Коммунарке начинается осень, значит пришло время пересмотреть Бегущего (теперь уже два), открыть бутылочку Амаретто и написать следующую статью про всеми любимый Python. В данном случае поговорим о том, сколько на самом деле у нас вакансий на Python для веб-разработчиков.

Читать далее

+11

Mojsha 15 сен 2021 в 18:48

MPIRE — быстрая альтернатива multiprocessing

16 мин

5.3K

Блог компании SkillfactoryOpen source * Python * Программирование * Параллельное программирование *

Туториал

Перевод

MPIRE комбинирует функции, подобные map из multiprocessing.Pool, с преимуществами копирования при записи общих объектов multiprocessing.Process. В пакете также есть простые в работе функции состояния рабочего процесса, информирования о нём и индикатора выполнения. Сокращённым переводом документации делимся к старту курса по Fullstack-разработке на Python.

Читать далее

+16

Mojsha 14 сен 2021 в 18:00

PyFilesystem — мощная альтернатива pathlib

8 мин

9.6K

Блог компании SkillfactoryЛайфхаки для гиковПроектирование API * Программирование * Python *

Туториал

Перевод

Написанная с помощью PyFilesystem функция поиска дубликатов файлов будет работать без изменений с жёстким диском, zip-файом, FTP-сервером, Amazon S3 и т. д., этот API абстрагирует от физического расположения файла. В нём меньше способов выстрелить себе в ногу, чем у модулей os и io. Руководством из документации делимся к старту курса по Fullstack-разработке на Python.

Читать далее

+19

yaAubakirov 14 сен 2021 в 07:31

Работа с pdf-файлами с помощью библиотеки fitz

4 мин

37K

Возникла идея создать небольшую утилиту на Python, которая будет парсить PDF и сверять со списком швов, взятых из BIM модели. Изначально я обратился к библиотеке pdfminer, вернее к ее форку pdfminer.six. Но скорость работы меня совершенно не устраивала. Вот, например, загрузка файла в 10 страниц и парой картинок.

Читать далее

+16

worksolutions 13 сен 2021 в 15:20

Нейродайджест: главное из области машинного обучения за август 2021

4 мин

4.8K

TensorFlow * Искусственный интеллектМашинное обучение * Python *

Новая архитектура-генералист для работы с комбинированными типами данных от DeepMind, генерация внешности от младенчества до глубокой старости, синтез фотореалистичных изображений по наброску и многое другое в августовской подборке.

Перейти к обзору

+15

1 2 ...

111

112 113 ...