Все потоки
Поиск
Написать публикацию
Обновить
419.39

Python *

Высокоуровневый язык программирования

Сначала показывать
Порог рейтинга
Уровень сложности

Учимся использовать Yandex SpeechKit с помощью Python за 5 минут

Время на прочтение5 мин
Количество просмотров55K

Год назад для собственных нужд я написал обертку Yandex SpeechKit на Python, она получилась настолько простая и универсальная, что грех не поделиться : )

Читать далее

PyCon Russia 2022: два дня докладов, песни под гитару и костер в центре Москвы

Время на прочтение3 мин
Количество просмотров2.3K

Товарищи! PyCon Russia 2022, о необходимости которого все время говорили большевики питонисты, совершился! 30 и 31 июля в Москве состоялась самая долгожданная, уютная и душевная конференция для python-разработчиков и специалистов data science и ml. Мы выдохнули и спешим рассказать, как это было. 

Не секрет, что этот год для организации IT-движух выдался трудным (как, впрочем, и предыдущие два). Кто-то уже релоцировался, кто-то в процессе, а кому-то участвовать не позволила религ обстановка в стране… Поэтому мы невозможно рады, что наш PyCon Russia состоялся! Спикеры были крутые, доклады классные, а участников оказалось ничуть не меньше, чем в более спокойные годы. Спасибо всем, кто в нас поверил, – вместе мы опять сделали тусовку незабываемой. А теперь к сути. 

Читать далее

Восстановление (импутация) данных с помощью Python

Время на прочтение8 мин
Количество просмотров18K

На данный момент Python является самым популярным языком программирования, который применяется для анализа данных или в машинном обучении. Сильными сторонами Python являются его модульность и возможность интегрироваться с другими языками программирования.

В науке о данных разведочный анализ данных (exploratory data analysis, EDA) является самым важным этапом в проекте и занимает около 70-80% времени всего проекта. Такой анализ позволяет изучить какие-то свойства данных, найти в них закономерности, аномалии, очистить их, подготовить и построить начальные модели для дальнейшей работы. На этом этапе можно определить вид распределения, оценить основные его параметры, обнаружить выбросы, построить матрицу корреляции признаков и т.д.

Читать далее

4х повышение разрешения изображения с использованием ESRGAN

Время на прочтение2 мин
Количество просмотров12K

4х повышение разрешения изображения с использованием ESRGAN

В данной статье разобрано применение предобученной нейронной сети ESRGAN для увеличения разрешения изображения в четыре раза c использованием tensorflow hub.

Читать далее

“Да кто это написал?!!”, или решение сложных задач простыми средствами

Время на прочтение5 мин
Количество просмотров14K

Привет, Хабр! Каждый день тысячи программистов трудятся не покладая рук. Они пишут код, контактируют между собой и, как и любой человек, совершают ошибки. Проблемы в коде могут повысить уровень рисков и стать критическими для компании. И с целью выявления таких ошибок специалисты проводят анализ кода.      

Интересно!

Устаревшие Python-библиотеки, с которыми пора попрощаться

Время на прочтение11 мин
Количество просмотров34K

В Python, с каждым релизом, добавляют новые модули, появляются новые и улучшенные способы решения различных задач. Все мы привыкли пользоваться старыми добрыми Python-библиотеками, привыкли к определённым способам работы. Но пришло время обновиться, время воспользоваться новыми и улучшенными модулями и их возможностями.

Читать далее

Обработка изображений с помощью библиотеки Python Pillow

Время на прочтение33 мин
Количество просмотров189K

Данный туториал является переводом статьи, написанной Stephen Grupetta. Все изображения и коды скопированы без изменений. В конце вы найдете примечания относительно данной информации, а также ссылку на github с работающим кодом. Если код, приведенный автором не запускается, переходите в примечания и, возможно, сможете найти решение вашей ошибки.

Читать далее

Интерпретация summary из statsmodels для линейной регрессии

Время на прочтение7 мин
Количество просмотров25K

Узнал я о линейной регрессии после того, как встретил деревья, нейронные сети. Когда мы с другом повторно изобретали велосипед, обучая с нуля word2vec и использовали логистическую регрессию с векторами из обученной модели для задачи NER – я активно кричал о том, что линейная регрессия – прошлый век, никому она уже совсем не нужна.

Да, проблема была в том, что я совсем не разобрался в вопросе и полез в бой. Но практику в универе нужно было как-то закрывать.
После семестра мат. статистики ко мне пришло прозрение.

Читать далее

Поиск открытого API сайта или Ускоряем парсинг в 10 раз

Время на прочтение4 мин
Количество просмотров32K

Поиск открытого API сайта или Ускоряем парсинг в 10 раз


image


Цель статьи — описать алгоритм действий поиска открытого API сайта.
Целевая аудитория статьи — программисты, которым интересен парсинг и анализ уязвимостей сайтов.


В статье рассмотрим пример поиска API сайта edadeal.ru, познакомимся с протоколом google protobuf и сравним скорость различных подходов парсинга

Читать дальше →

Распознавание поднятых пальцев на Python+OpenCV

Время на прочтение4 мин
Количество просмотров15K

В данной статье хочу рассмотреть банальный и не сложный проект, а именно подсчет количества поднятых пальцев.

Все исходники можно найти на моем Github.

Код будем рассматривать с самого начала, но лучше всего ознакомиться с моими предыдущими статьями.

Подготавливаем среду и устанавливаем следующие библиотеки:

Читать далее

Как [не надо] ломать систему типов Python, или Криминал в сопоставлении с образцом

Время на прочтение5 мин
Количество просмотров5.5K

__subclasshook__ — один из моих любимых элементов Python. Абстрактные базовые классы (ABC — Abstract Base Class) с помощью __subclasshook__ могут указывать, что считается подклассом ABC, даже если целевой класс не знает об ABC:

Прочитать до конца

Все, что нужно знать об ALBERT, RoBERTa и DistilBERT

Время на прочтение9 мин
Количество просмотров17K

Обзор различий и сходств различных трансформеров BERT из библиотеки Hugging Face и как их использовать 

Читать

Программирование на Python и установка Docker для Sipeed Lichee RV RISC-V

Время на прочтение15 мин
Количество просмотров10K
Lichee RV

В первой части познакомились с процессором Allwinner D1 на RISC-V архитектуре, рассмотрели возможности, поработали с одноплатным компьютером Sipeed Lichee RV. Старый образ операционной системы содержал многие недоработки, которые не позволяли полностью оценить работу одноплатника. В продолжение рассмотрения Lichee RV, возьмем новый образ Ubuntu, построенный на последнем ядре Linux 5.19, окончательный выпуск которого ожидается в конце июля 2022 года. Поработаем с GPIO из Python`а и установим Docker. Теперь полноценно протестируем новый образ, проверим на что способна плата и начнем уже программировать на Python.
Читать дальше →

Ближайшие события

Опыт участия в Kaggle соревновании Ubiquant Market Prediction или как плохая организация может убить любое соревнование

Время на прочтение7 мин
Количество просмотров2.3K

В период с 18 января по 18 июля на сайте Kaggle проходило соревнование Ubiquant Market Prediction от китайской компании Ubiquant Investment. Я поучаствовал в этом соревновании и мой опыт участия оказался скорее негативным, в первую очередь из-за отвратительной организации соревнования, но об этом позже. Для начала давайте расскажу, что это было за соревнование.

Читать далее

Как стажёр оптимизировал запросы и нашел баг в Django

Время на прочтение10 мин
Количество просмотров21K

Привет! Меня зовут Иван, я бэкенд-разработчик-стажёр в KTS.

Недавно я нашел баг в Django, создал тикет с исправлением и его приняли.

В статье расскажу подробнее — над чем работал, в чем была ошибка и почему ее сложно встретить. А также еще про один баг, который по классике оказался фичей.

Читать далее

Feature Engineering или стероиды для ML моделей

Время на прочтение6 мин
Количество просмотров20K

Привет, чемпион!

Часто при построении ML моделей мало просто взять сильную модель. Оказывается, иногда грамотная предобработка данных существенно важнее. Сегодня речь пойдёт про feature engineering.

Рассмотрим несколько кейсов на эту тему более подробно. Данные будут упрощённые, но обещаю, от этого примеры не станут менее интересными ?.
Читать дальше →

Albumentations: Feedback

Время на прочтение5 мин
Количество просмотров2.4K

Warning: Текст ниже сухой, так как написан больше для публичного логирования и интересен будет скорее тем, кто библиотеку уже использует.

Читать далее

Бутстреп и А/Б тестирование

Время на прочтение10 мин
Количество просмотров76K

Привет, Хабр! В этой статье разберёмся, как с помощью бутстрепа оценивать стандартное отклонение, строить доверительные интервалы и проверять гипотезы. Узнаем, когда бутстреп незаменим, и в чём его недостатки. 

Читать далее

Сам себе data scientist или зачем нужен анализ данных менеджеру по продажам

Время на прочтение15 мин
Количество просмотров5.9K

Всем привет! Меня зовут Михаил Тимофеев, я работаю специалистом в отделе телемаркетинга в Ростелекоме. Когда начинал работать менеджером по продажам, меня постоянно мучали вопросы: почему клиент отказался, где моя зона роста, что делать, чтобы продавать больше? И тогда я решил все взять в свои руки.

В статье я расскажу о своём опыте создания DIY-системы учета и прогноза продаж в Excel (или его аналоге Cacl из пакета LibreOffice), Power BI и Python 3 с подключенной библиотеками Pandas, NunPy и MatPlotLib.

Читать далее

Использование SymPy в вычислениях

Время на прочтение4 мин
Количество просмотров15K

Добрый день уважаемые пользователи. Данная статья ориентированна на начинающих программистов. Как вы знаете для Python существует большое множество библиотек которые помогают с вычислениями. И я хотел бы поделиться одной из библиотек, которая может существенно помочь при вычислениях, но использовать ее в коде я не рекомендую. Но она может значительно облегчить вам жизнь, если вы решаете уровнения и занимаетесь их преобразованием, упрощением для дальнейшего использования.

Библиотека SymPy умеет многое, начиная с решения уравнений и заканчивая построениями графиков, но тут я хотел рассмотреть на примерах, как же работают функции "упрощения" в этой библиотеке на примере решения нескольких простых задач.

Приступим!)

Читать далее

Вклад авторов