Все потоки

Python *

Высокоуровневый язык программирования

СтатьиПостыНовостиАвторыКомпании

MaxRokatansky 20 мая 2022 в 09:56

Подсказки по типам Python — Как сузить количество типов с помощью TypeGuard

2 мин

5.9K

Блог компании OTUSPython *

Перевод

Ранее я уже рассказывал о сужении типов с помощью isinstance(), assert и Literal. В сегодняшней заметке мы рассмотрим TypeGuard, новый специальный тип, который позволяет нам создавать кастомные функции сужения типов.

Читать далее

+4

NewTechAudit 20 мая 2022 в 03:12

PyCUDA или этому коду нужно ускорение

4 мин

9.3K

Python * Программирование * Машинное обучение *

Рассмотрим библиотеку PyCUDA, как альтернативу CUDA для C/C++. Оценим её возможности и проведем сравнение производительности на конкретном примере, а именно реализуем алгоритм Харриса для детекции углов на изображении.

Читать далее

+8

honyaki 19 мая 2022 в 19:27

Как рисовать диаграммы в Seaborn

10 мин

81K

Блог компании SkillfactoryPython * Программирование * Визуализация данных *

Перевод

Начинающие аналитики могут смело класть эту шпаргалку в закладки, а мы приглашаем вас под кат за диаграммами и кодом, пока начинается наш курс по анализу данных. Для удобства мы сократили текст и перенесли его часть в комментарии, ближе к нужным строкам кода.

Читать далее

0

Colindonolwe 19 мая 2022 в 09:43

Практические применения генеративных моделей: как мы делали суммаризатор текстов

9 мин

18K

Блог компании SberDevicesNatural Language Processing * Python * Искусственный интеллектМашинное обучение *

В последнее время вышло большое количество генеративных моделей для русского языка. Команды Сбера выпустили целое семейство авторегрессионных моделей ruGPT3, ruT5, о которых мы подробно писали ранее. Сегодня мы расскажем, как практически применять обучение таких моделей и какие продукты можно получить на их основе.

Мы выводим в открытый доступ два новых сервиса: Рерайтер и Суммаризатор. Модель «Рерайтер» способна переписать любой текст другими словами с сохранением смысла вне зависимости от длины и формата — от новостей и художественной литературы до постов в социальных сетях. Модель «Суммаризатор» позволяет создать сжатое изложение исходного текста, сохраняющее его главные тезисы. Эта модель может быть полезна для экономии времени читателя, а также выделения главных мыслей объёмных документов, научной или бизнес-литературы. В частности, использовать сервис можно для подготовки обзоров научных работ на заданную тему, создания новостных дайджестов, выделения наиболее важных событий в лентах информагентств для аналитики.

Читать дальше →

+14

tumbler 19 мая 2022 в 06:35

Как написать свой прокси с кроликом и рейт-лимитами и не изменить змее с сусликом

5 мин

6.7K

Python * Проектирование и рефакторинг * Распределённые системы *

Пару лет назад мы в Just Work делали несколько похожих проектов, которые должны были обрабатывать данные, получаемые из одного внешнего HTTP API. Это API, несмотря на согласованные повышенные лимиты, изредка банило наши ключи доступа за малейшее превышение. Из-за этого ответственность за соблюдение лимитов лежала на клиентах. В дальнейшем, проектов, использующих это API, должно было становиться все больше, и заказчика не устраивала перспектива разбираться с каждой реализацией по отдельности.

В итоге было решено сделать собственный прокси-сервер, который реализовывал бы контроль скорости и предоставлял бы асинхронный доступ к API.

Читать далее

+8

kesn 19 мая 2022 в 05:26

Мой опыт с резиновым мужиком. Github Copilot

15 мин

31K

Машинное обучение * GitHub * Программирование * Python * Ненормальное программирование *

Первая моя ассоциация с Github Copilot - это резиновый мужик-автопилот из фильма "Аэроплан". Помню, в детстве я увидел этот фильм и потом реально думал, что так автопилоты и выглядят: какая-то смешная резиновая кукла надувается и начинает управлять самолётом. И вот, через столько лет меня не покидает ощущение, что передо мной надувается какая-то кукла и пытается писать за меня код.

Короче, нежданно-негаданно мне пришёл инвайт в GitHub copilot. Я и забыл про то, что когда-то запрашивал доступ - ажиотаж давно уже спал, вроде мир не захвачен машинами, а значит, не такой уж он и крутой, да? С другой стороны, недавно к нам на позицию senior python постучал чел и сказал, что большую часть нашего тестового задания он запилил при помощи copilot, так что определённо кто-то "пилотом" пользуется. В общем, непонятно: хорошо оно или плохо? Стану ли я теперь более продуктивным? Есть только один способ проверить: в бою.

+86

XenixFSociety 18 мая 2022 в 21:48

Пишем простой сервер на Python

2 мин

96K

Python * Серверное администрирование *

Из песочницы

Ну, начнем как и везде с определений, берите тетрадь и ручку сейчас начнется нудятина. Чтобы мы cмогли написать свой сервер, нужно для начала понимать как он вообще работает, ловите определение:

Читать определение

-3

MaxRokatansky 18 мая 2022 в 11:10

Кластеризация, которую легко осуществить с помощью PyCaret

8 мин

13K

Блог компании OTUSPython * Машинное обучение *

Перевод

Одной из фундаментальных задач неконтролируемого машинного обучения является кластеризация. Цель этой задачи — классифицировать экземпляры заданного набора данных в различные кластеры на основе их общих характеристик. Кластеризация имеет множество практических применений в различных областях, включая маркетинговые исследования, анализ социальных сетей, биоинформатику, медицину и другие. В этой статье мы рассмотрим пример кластеризации с помощью PyCaret, библиотеки Python, которая поддерживает все основные задачи машинного обучения, такие как регрессия, классификация, кластеризация и обнаружение аномалий. PyCaret упрощает рабочий процесс машинного обучения, следуя лоукод-концепции, что делает ее отличным выбором как для новичков, так и для экспертов, которые хотят быстро создавать прототипы ML-моделей.

Читать далее

+2

RekGRpth 18 мая 2022 в 08:51

Рецепты REST OData в 1C: Python vs… PL/pgSQL !?

8 мин

8.7K

PostgreSQL * Python * 1С *

Туториал

Для приготовления CRUD нам понадобится 1C, Python и ... PostgreSQL. Сначала нужно включить REST OData в 1C.

Читать далее

0

zoldaten 18 мая 2022 в 07:23

Вывод аудио на несколько источников на raspberry pi

2 мин

7.7K

DIY или Сделай самPython * Raspberry Pi *

Туториал

В статье пойдет речь о том как вывести аудио, проигрываемое на raspberry pi на несколько источников (проигрывателей) одновременно. В частности, аудио будет параллельно транслироваться по hdmi, на audio jack, bluetooth устройство (устройства).

Читать дальше →

+8

UtrobinMV 18 мая 2022 в 07:05

Большое сравнение 400 нейронных сетей для задачи классификации на более 8000 классов

7 мин

16K

Python * Data Mining * Машинное обучение * Искусственный интеллектData Engineering *

Думаю, вы знакомы с графиками сравнения точности архитектур. Их применяют в задачах по классификации изображений на ImageNet.

В каждом сравнении которые я мог встретить ранее в Интернете, как правило это было сравнение небольшого количества архитектур нейросетей, произведенными разными командами, и возможно в разных условиях.

Кроме того в последнее время я наблюдаю изменения: появилось большое количество архитектур. Однако их сравнений с ранее созданными архитектурами я не встречал, либо оно было не столь масштабным.

Мне захотелось столкнуть большое количество существующих архитектур для решения одной задачи, при это объективно посмотреть как поведут себя новые архитектуры типа Трансформер, так и ранее созданные архитектуры.

Читать далее

+10

Andrey_Solomatin 18 мая 2022 в 06:12

О плохом и хорошем коде

8 мин

6.8K

Чтобы понять хороший код или плохой, недостаточно на него посмотреть, надо еще знать и контекст, в котором он написан. Давайте попробуем решить одну простую задачу тремя способами и найдем в каком контексте каждое решение будет хорошим или плохим. Задача простая, но вполне жизненная: взять данные, поменять, сохранить.

Читать далее

+8

mihailgok 17 мая 2022 в 20:15

Создание telegram web apps и взаимодействие с ними в телеграм ботах

8 мин

440K

Программирование * JavaScript * Python * CSS * HTML *

Из песочницы

В обновлении Bot API 6.0 телеграм-боты получили много новых функций. Из них для разработчиков самая примечательная - Telegram Web Apps (Веб-приложения внутри телеграм). С этим нововведением разработчики могут подключать к своим ботам web-приложения, которые открываются в дополнительном окне, что сильно расширяет инструментарий, а, следовательно и функционал ботов в телеграм.

Читать далее

+32

dzis_science 17 мая 2022 в 14:58

Категориальные признаки

8 мин

99K

Data Engineering * Data Mining * Python *

Из песочницы

Не одним One-Hot единым...

В данной статье разберемся с кодированием категориальных данных. В профессиональной среде нередко о существовании чего-то кроме OH или Label Encoder не догадываются не только рядовые Junior DS, но и даже Middle, а иногда и Senior. Исправить данную несправедливость и призвана данная статья.

Читать далее

+2

NewTechAudit 17 мая 2022 в 03:35

Работа с API HeadHunter при помощи python

4 мин

38K

Python * Программирование * Проектирование API *

Туториал

Разбираемся на практике с API HeadHunter при помощи python.

Появилась задача анализа вакансий на рынке труда, и осуществлять ее надо базе HeadHunter. Необходимо получить все вакансии определенной компании по всем городам России. Ознакомившись с документацией по API на github (https://github.com/hhru/api), приступаем к работе.

Читать далее

-1

rikki_tikki 16 мая 2022 в 17:06

Разбираемся с декораторами в Python

9 мин

98K

Блог компании OTUSPython *

Перевод

Декораторы – это обертка вокруг функций (или классов) в Python, которая меняет способ работы этой функции. Декоратор абстрагирует свой собственный функционал. Нотация декоратора в целом наименее инвазивна. Разработчик может писать свой код так, как ему хочется, и использовать декораторы только для расширения функциональности. Все это звучит крайне абстрактно, поэтому давайте обратимся к примерам.

Читать далее

+15

mr-pickles 16 мая 2022 в 10:05

Развёртывание XGBoost-моделей с помощью Ray Serve

8 мин

3.6K

Блог компании Wunder FundМашинное обучение * Программирование * Python *

Перевод

XGBoost — это оптимизированная библиотека, реализующая алгоритм градиентного бустинга. Эта библиотека спроектирована с прицелом на высокую продуктивность и гибкость, в ней используется параллельная работа с древовидными структурами, что позволяет быстро и эффективно решать различные задачи из сфер Data Science и Machine Learning. В предыдущем материале мы исследовали три подхода к ускорению обучения XGBoost-моделей.

Читать далее

+14

e1vanov 13 мая 2022 в 15:33

W-функция Ламберта и ее приложения

3 мин

22K

Python * Алгоритмы * Математика * Программирование *

Из песочницы

Математический анализ знает множество замечательных функций со своими удивительными свойствами и применениями. Сегодня я бы хотел рассказать читателю об одной из таких - W-функции Ламберта.

Читать далее

+22

mogilyoy 13 мая 2022 в 13:20

Робот-самурай ч.2. Хокку-бот для постинга в ВК

6 мин

3.2K

Рассматриваем, как публиковать автоматические "хокку" в Телеграм канал и группу ВК.

Смотреть

+2

mr-pickles 12 мая 2022 в 10:17

Три подхода к ускорению обучения XGBoost-моделей

9 мин

20K

Блог компании Wunder FundPython * Программирование * Машинное обучение *

Перевод

Фреймворк XGBoost (Extreme Gradient Boosting, экстремальный градиентный бустинг) — это эффективная опенсорсная реализация алгоритма градиентного бустинга. Этот фреймворк отличается высокой скоростью работы, а модели, построенные на его основе, обладают хорошей производительностью. Поэтому он пользуется популярностью при решении задач классификации и регрессии с использованием табличных наборов данных. Но процесс обучения XGBoost-моделей может занять много времени.

Читать далее

+11

1 2 ...

225

226 227 ...