Python *

Высокоуровневый язык программирования

673,44

Рейтинг

СтатьиПостыНовостиАвторыКомпании

kmoseenk 7 апр 2023 в 10:02

Декораторы Python: пошаговое руководство

11 мин

315K

Блог компании OTUSPython *

Туториал

Перевод

Понимание декораторов является важной вехой для любого программиста Python. Эта статья представляет собой пошаговое руководство о том, как декораторы могут помочь вам стать более эффективным и продуктивным разработчиком на Python.

+17

linatimelord 7 апр 2023 в 09:51

Визуализация 5 алгоритмов сортировки на Python

Простой

7 мин

108K

Блог компании KTSPython * Алгоритмы *

Туториал

Перевод

Сортировка массивов часто используется в программировании, чтобы помочь понять данные и выполнить поиск. Поэтому скорость сортировки больших объемов информации крайне важна для функциональных проектов и оптимизации времени работы. Есть много алгоритмов для упорядочения объектов.

В статье вы посмотрите на реализацию и визуализацию пяти популярных алгоритмов сортировки: выбором, пузырьком, вставками, слиянием и быстрой сортировкой.

Код написан на Python, а графический интерфейс построен на Tkinter.

+34

nadejda_cherneva 7 апр 2023 в 08:51

Основные инструменты для работы в Data Engineering: введение для начинающих Data Engineer'ов

Простой

8 мин

16K

Big Data * Data Engineering * Data Mining * Python *

Из песочницы

Всем привет!

Меня зовут Надя, я занимаю должность Data Engineer в компании, которая специализируется на разработке мобильных игр. В этой статье я хочу поделиться информацией об основных инструментах, которые я использую в своей работе с данными, и рассказать о каждом из них подробнее.

yet_another_mle 6 апр 2023 в 18:03

Распознаем автомобильные номера на TorchServe

Средний

4 мин

8.9K

Python * Машинное обучение * Искусственный интеллект

Вокруг так много фреймворков для инференса нейронок, что глаза разбегаются. Продолжаем цикл о реализации сервинга задачи распознавания номеров разными инструментами. В прошлый раз это был Triton, а сейчас TorchServe.

ph_piter 6 апр 2023 в 14:03

Книга «Машинное обучение. Портфолио реальных проектов»

11 мин

8.3K

Блог компании Издательский дом «Питер»Python * Искусственный интеллектМашинное обучение * Профессиональная литература *

Привет, Хаброжители!

Изучите ключевые концепции машинного обучения‚ работая над реальными проектами! Машинное обучение — то, что поможет вам в анализе поведения клиентов, прогнозировании тенденций движения цен, оценке рисков и многом другом. Чтобы освоить машинное обучение, вам нужны отличные примеры, четкие объяснения и много практики. В книге все это есть!

Автор описывает реалистичные, практичные сценарии машинного обучения, а также предельно понятно раскрывает ключевые концепции. Вы разберете интересные проекты, такие как сервис прогнозирования цен на автомобили с использованием линейной регрессии и сервис прогнозирования оттока клиентов. Вы выйдете за рамки алгоритмов и изучите важные техники, например развертывание приложений в бессерверных системах и запуск моделей с помощью Kubernetes и Kubeflow. Пришло время закатать рукава и прокачать свои навыки в области машинного обучения!

Читать дальше →

Ander_kot 6 апр 2023 в 11:22

EasySteamPaybot или как я помогал людям пополнять Steam

Простой

11 мин

18K

Python * Проектирование API *

Из песочницы

И так в марте 2022 Steam отключила в российском сегменте Steam все основные способы оплаты для пользователей из России.

Я на тот момент активно изучал новый для себя язык Python, и решил потренироваться создав бота позволяющего быстро и просто пополнять пользователям пополнять свой steam аккаунт.

В этой статье описана структура проекта, принцип его работы и раскрыты некоторые особенности реализации.

Тоже так могу !

kath_vyunova 6 апр 2023 в 09:14

Как я решила попробовать себя в ML: анализ эмоциональной окраски отзывов с Кинопоиска 2.0

Простой

4 мин

3.6K

Python * Алгоритмы * Машинное обучение *

Из песочницы

Недавно я решила попробовать реализовать задачу анализа эмоциональной окраски отзывов с Кинопоиска. Я бы хотела поделиться своим опытом и описать шаги, которые использовала для реализации стоящей передо мною задачей.

Итак, в самом начале у меня был только датасет и опорный план для дальнейшей реализации всего этого дела, приступим :)

Шаг 1: получение данных | main.py + reviews_data.zip

Скачиваем json-файлы с отзывами и затем читаем данные из файла. Добавляем полученные отзывы в общий список.

GolovinDS 6 апр 2023 в 09:08

Полезные методы работы с данными в Pandas. Часть 1

Средний

10 мин

20K

Блог компании OTUSPython *

Обзор

Сегодня анализ данных стал неотъемлемой частью многих сфер деятельности, от науки до бизнеса. Python является одним из самых популярных инструментов для работы с данными, благодаря своей гибкости и обширному спектру доступных библиотек. Одной из таких библиотек является Pandas, предоставляющая удобные структуры данных и множество функций для анализа и обработки информации.

В этих статьях (их будет несколько и их количество зависит от заинтересованности читателя) мы сосредоточимся на изучении некоторых полезных, но менее известных методов работы с данными в Pandas, которые могут значительно повысить вашу эффективность при анализе и обработке данных. Мы рассмотрим различные функции и техники для таких задач, как разделение данных на интервалы, квантильное разделение, применение скользящих окон для вычислений, смещение данных для временных рядов, преобразование вложенных структур данных, нормализация сложных JSON-структур и управление многоуровневыми индексами при работе с DataFrame и Series.

NewTechAudit 6 апр 2023 в 08:00

Снижаем размерность эмбеддингов предложений для задачи определения семантического сходства

Средний

10 мин

5.9K

Машинное обучение * Natural Language Processing * Python *

Кейс

✏️ Технотекст 2023

Привет, Хабр!

Меня зовут Николай Шукан, я Data Scientist и участник профессионального сообщества NTA. Сегодня речь пойдет о методах снижения размерности эмбеддингов для задач определения семантического сходства предложений.

С каждым годом растет сложность моделей, решающих вопросы семантически- и контекстно-ориентированной обработки естественного языка (NLP). Также нельзя забывать и про проблемы мультиязычности моделей. Все это сильно сказывается на увеличении их размеров и системных требований к железу для их обучения, дообучения, да и просто запуска.

Перед мной стояла задача найти и обобщить текстовые данные, представляющие собой массив предложений. Я точно знал, что среди них есть семантически схожие фразы. Однако прямой подход для определения семантического сходства наборов фраз требовал очень много памяти и времени. Чтобы решить эту проблему, я попытался уменьшить размерность векторов признаков предложений, но как понять, когда остановиться и что это даст?

Узнать подробности

Autechre 5 апр 2023 в 15:12

Предварительная обработка данных с помощью библиотеки Pandas (Задача)

Простой

5 мин

22K

Python * Восстановление данных *

Из песочницы

В современном мире большинство бизнес-процессов связаны с обработкой больших объемов данных, получаемых от различных источников. Часто эти данные содержат ошибки, дубликаты и пропуски, что может привести к неверным выводам и решениям. Одним из инструментов, которые позволяют очистить и преобразовать данные, является библиотека pandas для языка программирования Python.

Я собираюсь рассмотреть задачу по очистке данных с помощью pandas. Для этого возьмем данные, содержащие дубликаты строк, неправильные типы данных, пропуски и отрицательные значения. Затем я буду использовать функциональные возможности pandas для очистки и преобразования этих данных в форму, пригодную для дальнейшего анализа.

Предположим, у вас есть набор данных, содержащий информацию о продажах компании за последние несколько лет. Но данные не очень чистые, и вы заметили, что есть некоторые проблемы с форматированием и некоторые строки содержат ошибки.

Задача: Необходимо очистить данные о продажах компании за последние несколько лет с помощью библиотеки Pandas.

lenant 5 апр 2023 в 12:44

Руки на руль: Bus Factor следит за тобой

Простой

3 мин

2.2K

Блог компании DoubletappPython * Машинное обучение * Искусственный интеллектТранспорт

Кейс

Привет, Хабр, меня зовут Антон Рябых, работаю в Doubletapp. Расскажу вам о том, как мы придумали сервис, контролирующий поведение водителей общественного транспорта с помощью алгоритмов машинного обучения и компьютерного зрения.

К нам обратилась компания «Термотех», которая занимается городскими перевозками. Организатору движения нужно было автоматически понимать, что:

• водитель общественного транспорта не пользуется телефоном во время движения;
• камера, установленная в салоне водителя, снимает с верного ракурса, не отвернута в сторону;
• от камеры в целом идет сигнал, она не повреждена, не завешена и не загрязнена.

Ранее задача решалась силами сотрудников «Термотеха» — они вручную просматривали все записи с камер видеонаблюдения, установленных в кабинах водителей. Такой подход занимал огромное количество времени и все равно приводил к ошибкам, основанным на человеческом факторе.

• Как мы решали эту задачу?
• Как это работает?

gerasimovich 5 апр 2023 в 05:54

5 поводов выступить с докладом на PyCon Russia. Какой из них твой?

2 мин

941

Блог компании IT-PeopleКонференцииPython *

Привет! Мы продолжаем собирать программу на PyCon Russia. Уверены, тебе есть что рассказать Python-сообществу. Оторвись от работы, весенних прогулок, плойки, Хабра, вышивания крестиком и чем ты там прямо сейчас занимаешься =) . Сосредоточься и отправь заявку — до второго мая осталось совсем немного времени, чтобы занять свой слот в программе (да и самих слотов — раз, два и обчелся).

Немного мотивации:

rikki_tikki 4 апр 2023 в 12:17

Как я заставил Python взаимодействовать с Kotlin

4 мин

Блог компании OTUSKotlin * Python *

Перевод

Я работаю с POC (proof-of-concept. проверка концепции), где мы используем Ktor (Kotlin Framework) в качестве бекэнда DSL. В этом проекте нами извлекается обобщенное резюме из значительного объема текста. Мы столкнулись с проблемой написания кода машинного обучения на Kotlin. Kotlin молод по сравнению с Python, R и т.д.

denisxab 4 апр 2023 в 11:41

Как использовать промты в ChatGPT для генерации кода на Python

2 мин

78K

Python * Программирование *

Кейс

Recovery Mode

Привет, друзья! Сегодня я хочу рассказать вам о том, как использовать промты в ChatGPT для создания программного кода на Python. Если вы работаете с Python или интересуетесь программированием, то вы, наверняка, знаете, насколько важно уметь быстро и эффективно создавать код.

Для тех, кто не знаком с термином "промт", это специальные подсказки, обычно они выводятся в виде текста, который указывает правила для ответа ИИ.

Чатбот ChatGPT основан на искусственном интеллекте и способен генерировать текст на основе предыдущих входных данных, так же основан на copilot. Таким образом, мы можем использовать его для генерации промтов для создания кода на Python.

После множества экспериментов и ошибок, я нашел наиболее оптимальный промт для работы с ChatGPT, который позволяет мне полностью автоматизировать процесс разработки программы в соответствии с моим ТЗ. Сейчас я готов поделиться с вами своим опытом.

+10

nalgeon 4 апр 2023 в 09:03

PokiToki: Удобный GPT-бот в телеграме

4 мин

27K

Программирование * Мессенджеры * Искусственный интеллектPython * Open source *

PokiToki

За последние месяцы только ленивый не сделал телеграм-бота, который работает с API OpenAI. Были такие статьи и на Хабре.

Написать игрушечного ChatGPT-бота можно хоть за час. А вот сделать его удобным в повседневной работе заметно сложнее. Я занимался этим последние несколько недель и хочу показать, что получилось.

Читать дальше →

+24

UprightMan 4 апр 2023 в 08:08

Быстрее, больше, сильнее: фреймворки Python с параллельной обработкой данных

12 мин

18K

Блог компании FirstVDSВысоконагруженные системы * Open source * Python * Программирование *

Хотите распределить тяжелую рабочую нагрузку в проектах на Python между несколькими процессорами или вычислительным кластером? В этой статье расскажем про лучшие фреймворки, которые помогут реализовать подобно желание на практике.

+13

pcdesign 3 апр 2023 в 12:05

Обучаем с помощью LlamaIndex и OpenAI GPT-3 отвечать по вашей базе знаний

Простой

7 мин

25K

Python * Искусственный интеллектFlask *

Туториал

Перевод

От переводчика.

У меня накопилось куча всяких там данных, документов, pdf, doc, видосов на ютюбе, которые я бы хотел проиндексировать, и чтобы можно было по этой базе знаний у нейронки что-нибудь спрашивать.

Так же статья может пригодиться, если вы хотите собрать базу знаний по какой-то компании и затем заставить нейронку отвечать на вопросы пользователей. Например, чтобы ИИ прочитала кучу скучной документации, регламентов работы и прочего.

Пока выбираю, на чем это лучше сделать. Вот наткнулся на нижеследующий вариант, который решил попробовать.

pas-zhukov 2 апр 2023 в 19:32

Titanic Survivors Data Research

Средний

17 мин

19K

Машинное обучение * Python *

Из песочницы

15 апреля 1912 года произошло крушение парохода «Титаник», став одной из самых значимых катастроф в истории человечества. В данной статье исследованы данные пассажиров Титаника, сделаны и проверены предположения о влиянии определённых факторов на вероятность человека выжить в той катастрофе. Анализ данных сопровождается примерами кода на Python, с использованием пакета Pandas. Построена и обучена модель нейронной сети, предсказывающая вероятность человека выжить в катастрофе с точностью 0.78 на тестовых данных. Модель построена на базе фреймворка pyTorch.

+10

CHELODOR3000 2 апр 2023 в 14:48

Определение внимания водителей за рулем — реализация прототипов

Средний

6 мин

3.6K

Python * Обработка изображений * Машинное обучение * Искусственный интеллект

Из песочницы

Задача контроля водителя очень актуальна в наше время. Должный контроль за состоянием водителей поможет сохранить здоровье автолюбителей, избежать многих дорожно-транспортных происшествий, тем самым снизив количество человеческих жертв.

В конце 2022 года нашей команде поступил запрос на решение данной задачи. Было необходимо предложить подходы, используя которые можно понять, насколько устал водитель, занят ли он какими-либо посторонними делами за рулем, куда он смотрит при выполнении маневров, открыты ли у него глаза (не спит ли он) и т.д.

После продолжительного изучения существующих исследований в данной области, было принято решение начать работу с разработки следующих прототипов.

+13

Dannyk1 2 апр 2023 в 06:12

Telegram бот, который улучшит любую IT компанию

2 мин

16K

Python *

Всем привет, в этой статье я хотел бы рассказать о создании бота для мониторинга систем (сайтов) и внутренних сервисов – их доступность/недоступность.

Кому данный бот будет полезен 100%?
Абсолютно всем!

Вы можете мониторить как одну систему, так и хоть 100, получать уведомления в Telegram и оперативно принимать меры по устранению проблем.

Вкратце опишу принцип работы бота. Есть список URL, первый поток бегает по ним и проверяет на доступность, если находит недоступный ресурс – помещает его в список не работающих ресурсов и оповещает нас о недоступности ресурса, временно удаляя неработающий ресурс из списка рабочих. В свою очередь список неработающих систем также мониторится и в случае обнаружения рабочего ресурса – нас оповещают об этом и ресурс, который был в списке неработающих покидает этот список.

Первое что мы делаем – это создаем бота в @BotFather. Придумываем имя и получаем токен. Итак, перейдем непосредственно к коду.

Импортируем нужные библиотеки, telebot (pyTelegramBotAPI) хорошая и лёгкая библиотека для создания бота на Python. Библиотека threading импортируется для запуска в несколько потоков.

-12

1 2 ...

211 212

213

214 215 ...

519 520