Python *

Высокоуровневый язык программирования

757,42

Рейтинг

СтатьиПостыНовостиАвторыКомпании

badcasedaily1 26 апр 2024 в 15:26

Мастерим собственные awaitables и циклы событий

Простой

5 мин

5.1K

Блог компании OTUSPython * Программирование *

Обзор

Привет, Хабр!

Библиотека asyncio на Питоне - это база для создания масштабируемых асинхронных приложений. Однако, даже при всем разнообразии возможностей, которые предоставляет asyncio, иногда возникает необходимость выйти за рамки стандартных методов и создать что-то свое, специально подходящее для конкретного проекта или задачи.

Для этого можно создавать собственные awaitables и кастомные циклы событий.

ipatov_dn 26 апр 2024 в 13:07

От кода до сертификата: Создание веб-приложения на Python Flask для автоматизации выдачи сертификатов

9 мин

6.6K

Flask * Python *

Туториал

Из песочницы

✏️ Технотекст 7

Привет всем! Меня зовут Дмитрий. Я надеюсь, что статья будет полезной и интересной для вас(не пинайте сильно, первый опыт, мысли путаются). Тема моей статьи — создание веб-приложения на Python Flask для автоматизации выдачи сертификатов и вдохновился написанием ее после прочтения Почта без хлопот: автоматизация отправки писем с помощью Python

IDeSeI 26 апр 2024 в 12:15

Проблема с которой я столкнулся при работе с генераторами

Простой

5 мин

245

Python *

Из песочницы

Работая с генераторами через map, filter и all я столкнулся с проблемой пустого массива: проблема состоит в том. Что передавая результат filter(...) в функцию all а после продолжая работать с генератором полученным от функции filter например преобразуя его в tuple, чтобы глянуть какие элементы попали в массив после прохода фильтра. Я получал пустой tuple.

Узнать больше

-5

webppdigital 26 апр 2024 в 11:15

Обработка данных для RAG-систем

Простой

8 мин

5.1K

Искусственный интеллектPython *

Из песочницы

Всем привет, меня зовут Андрей Шахов, я Python-разработчик и Lead Backend Developer в wpp.digital. ML-направлением, а точнее LLM в компании я начал заниматься только в конце 2023 года. Сейчас на задачи подобного рода у меня уходит примерно 40% рабочего времени.

Решил начать прокачку с простой внутренней задачи — сократить время на поиск информации в корпоративной вики с помощью LLM. Бизнес-результат прозрачный — каждый сотрудник должен находить ответ на свой запрос за пару секунд, без долгого путешествия по всем страницам базы знаний.

yadro_team 26 апр 2024 в 09:22

Этому городу нужна конференция по FPGA: шесть актуальных докладов про разработку микроэлектроники в Санкт-Петербурге

3 мин

2.5K

Блог компании YADROПроцессорыКонференцииFPGA * Python *

Приглашаем верификаторов, RTL-инженеров и FPGA-разработчиков на конференцию FPGA-Systems 2024.1 в Санкт-Петербурге и онлайн. Обсудим аспекты безопасности в рамках систем на кристалле, тестирование верификационных компонентов, фреймворк PyUVM и его использование для верификации цифровых дизайнов ASIC и FPGA, разработку трансиверов и многое другое.

Регистрация уже открыта — заполняйте форму по ссылке и присоединяйтесь к конференции. Под катом — полная программа встречи.

efreelancer 26 апр 2024 в 07:00

Обучение модели токсификации текстов с помощью TorchTune, подробное руководство

Средний

11 мин

5.3K

Natural Language Processing * Искусственный интеллектМашинное обучение * Python *

Туториал

Приветствую, хабровчане!

Сегодня пятница, поэтому предлагаю немного пошалить и поговорить о слегка необычном, но весьма забавном проекте обучения нейросетевой модели на базе LLaMA2 7B, которая умеет превращать невинные предложения на русском языке в чуть более "токсичные" их версии.

Но обучать модель мы будем не абы как, а при помощи недавно вышедшего в свет проекта под названием TorchTune, так как надо ведь пробовать новые инструменты, иными словами, предлагаю соединить тему интересную с темой полезной.

Так что пристегнитесь, будет весело и слегка токсично!

demonuga1998 25 апр 2024 в 16:04

Распознавание, хранение и поиск лиц в базе данных

Средний

3 мин

19K

Python * Машинное обучение * Искусственный интеллектPostgreSQL *

Из песочницы

В этой статье я максимально коротко и просто объясню принцип распознавания, хранения и поиска лиц в базе данных. В качестве примера будет использована библиотека Insightface и база данных PostgreSQL.

+25

pgubarev 25 апр 2024 в 14:00

Как решить типичные проблемы Django нестандартным подходом: Fake Injection

Средний

18 мин

8.1K

Блог компании СамолетDjango * Python * Веб-разработка * Тестирование веб-сервисов *

Кейс

Давайте признаем, что развитие проектов в мире Django не всегда проходит гладко. Мы часто сталкиваемся с толстыми моделями и сериалайзерами, размытой бизнес-логикой и тестированием, которое больше напоминает головную боль, чем удовольствие. Меня зовут Павел Губарев, я backend-разработчик продукта 10D в компании Самолет. Последние пять лет я занимаюсь backend-ом и большую часть времени я использую именно Django. С ростом проекта увеличивается и его сложность, в случае с Django есть набор часто встречающихся проблем. В этой статье я расскажу о методах нашей команды, которые помогли нам справиться с этими проблемами и привести код к новому уровню надежности и эффективности.

Читать дальше →

+22

Magn 25 апр 2024 в 12:22

Без холивара «переписать все на Go»: проблема переносимости в Python и ее решение

Средний

19 мин

20K

Блог компании «Лаборатория Касперского»Python * Программирование * Open source * Управление разработкой *

Обзор

✏️ Технотекст 7

На скриптовых языках удобно разрабатывать… И на этом удобство заканчивается. Вне машины разработчика начинаются проблемы. Особенно если вы пишете какой-то прикладной тулинг — cli-утилиты, вспомогательные приложения в вашем SDK и прочее. Вы даже не можете рассчитывать на то, что у пользователя будет pip, чтобы он смог поставить все ваши зависимости, вам все нужно организовать самостоятельно.

В этой статье поговорим о различных формах распространения Python-приложений. Какие есть подходы и инструменты, почему они могут не сработать и как чинить возникающие проблемы.

Если вам покажется, что в чем-то я ошибаюсь, добро пожаловать в комментарии. Буду рад услышать любые альтернативные точки зрения. Кроме, как я уже отметил в заголовке, рекомендации переписать все на Go/Rust/You name it :) Этот холивар мы уже проходили.

+75

sergios52 24 апр 2024 в 22:29

Обратный инжиниринг дешевой мини видеокамеры из семейства А9

Простой

21 мин

24K

Python * Беспроводные технологии * Реверс-инжиниринг * Видеотехника

Туториал

✏️ Технотекст 2023

В данной статье речь пойдет о Wi-Fi мини видеокамере из семейства А9 от китайских производителей. Цель исследования этих камер – расширить возможность их применения, которая ограничена использованием только стандартных приложений для мобильных устройств на базе Android или iOS.

По итогу представлен некоторый анализ дампа сетевого трафика между камерой и мобильным приложением, а на его основе предложен работающий код на Python.

+52

grigory_dl 24 апр 2024 в 11:21

Использование Markdown в Django

Простой

5 мин

6.1K

Django * Python * Веб-разработка *

Из песочницы

Привет, Habr!

В этой статье мы научимся использовать Markdown вместе с Django на примере блога. Она написана для новичков, для базового ознакомления. Её в формате .md можно скачать в моём развивающемся Telegram канале.

Markdown — это простой язык разметки, используемый для создания форматированного текста (например, HTML) с помощью текстового редактора. Кстати, эту статью я писал, использую синтаксис Markdown)

Продолжить чтение...

NoobodyKms 24 апр 2024 в 08:21

Моделирование курса валют методом Монте-Карло

Простой

12 мин

13K

Python * Математика *

Из песочницы

Метод Монте-Карло — это мощный инструмент стохастического моделирования, который используется в самых разнообразных областях науки и инженерии. В финансах, этот метод часто применяется для анализа и прогнозирования временных рядов, таких как курс валют или акций. Использование Монте-Карло позволяет оценить не только ожидаемые значения, но и распределение возможных исходов, что крайне важно для управления рисками и принятия обоснованных инвестиционных решений.

Принцип метода заключается в выполнении большого количества стохастических экспериментов (симуляций), основанных на случайных выборках из вероятностных распределений входных параметров. В контексте прогнозирования курса валют, это позволяет моделировать различные экономические сценарии и оценивать потенциальные колебания валютных пар, используя исторические данные.

Ключевой аспект использования Монте-Карло в финансах — это его способность учитывать и анализировать волатильность и дрейф курсов валют. Для повышения точности моделирования и реалистичности получаемых данных часто применяется ГАРЧ модель (Generalized Autoregressive Conditional Heteroskedasticity). ГАРЧ помогает адекватно оценить и моделировать изменчивость волатильности, что является критичным при анализе финансовых временных рядов.

Идейно код выполнялся без готовых реализованных методов из различных либ.

Проект использует следующие библиотеки и инструменты:

+11

SetGet 23 апр 2024 в 17:15

Пишем программу на Python для доступа к YandexGPT с помощью ChatGPT

Простой

37 мин

16K

Python * Программирование * Искусственный интеллект

Из песочницы

В данной программе можно будет самостоятельно составлять собственные system massage (в программе это называется «Специализация»), а это по сути своей программирование GPT модели естественным языком, так же можно будет изменять temperature (в программе это названо «Креативность») это изменяет вариативность ответов, при значении 0.0 на один и тот же вопрос будет получен всё время одинаковый ответ при 1.0 могут быть разные ответы с похожим смыслом но разные по словесному выражению, так же можно использовать две модели YandexGPT и YandexGPT Lite, вторая быстрее и чуть попроще но и дешевле в четыре раза. Описание программы в разделе меню «Информация».

Dmitry89 23 апр 2024 в 15:45

Async iterator timeout в Python

Средний

5 мин

3.7K

Блог компании OTUSПрограммирование * Python *

Обзор

Представим следующую задачу: у нас есть микросервисная архитектура, в которой сервисы взаимодействуют через брокер сообщений, или через gRPC. Так или иначе, оба варианта предоставляют полнодуплексный канал связи, через который один сервис может отправлять множество сообщений другому сервису, так и в обратную сторону - сервис, исполняющий запрос, может отправлять несколько ответов (например в случае потоковой обработки данных). Такой вариант реализации ответа можно в некотором смысле называть стримингом.

В числе прочих задач, решаемых при реализации возможности стриминга, существует задача определения ситуации, в которой сервис, исполняющий запрос, упал с ошибкой, и больше не может продолжать стриминг ответов. В таком случае мы даже не можем понять что именно произошло - обработка и отдача очередной порции ответа будет, но задерживается, либо же передача прервалась, и нужно сообщить об ошибке “наверх”. В протоколе HTTP, например, для детерминирования корректной вычитки ответа может быть использован заголовок Content-Length. Достаточно посчитать количество вычитанных из сокета байт тела запроса\ответа, и сравнить со значением заголовка. Сходится - мы все получили, не сошлось и сокет закрыт - ошибка. Однако вариант решения с заранее заданным количеством данных в первой порции ответов не является универсальным, поскольку не во всех случаях можно точно понимать, сколько именно данных будет передано. Да и архитектура с использованием брокеров сообщений предполагает постоянное поддержание соединения, поэтому мы можем только знать, что из такой-то очереди поступают ответы на ранее сделанный запрос, и в каком-то из ответов будет метка окончания, как маркер того, что запрос обработан и ответ выслан и получен полностью, а если такого маркера еще не получено - остается продолжать ждать. Но ждать можно бесконечно.

+10

diyor28 23 апр 2024 в 15:15

Как мы проанализировали 250,000 статей на VC, и поняли что делает посты успешными (возможно)

Простой

3 мин

3.7K

Python * Data Mining * Data Engineering *

Аналитика

Из песочницы

Привет, habr! ?

Вы когда-нибудь задумывались, почему некоторые посты набирают тысячи просмотров, а другие остаются незамеченными? Ясно, что Content is King, но есть ли дополнительные факторы, которые влияют на успешность поста?

Мы решили не гадать, а действовать. ?

Соскрейпили все посты на VC, а затем посчитали корреляции, чтобы выяснить, что же на самом деле привлекает внимание аудитории.

-3

ptsecurity 23 апр 2024 в 12:10

Python-праздник на Positive Hack Days Fest 2

Простой

3 мин

3.2K

Блог компании Positive TechnologiesКонференцииПрограммирование * Python * Информационная безопасность *

Дайджест

Двадцать шестого мая в рамках Positive Hack Days Fest 2 состоится Python Day, который мы проведем совместно с сообществом MoscowPython. Программный комитет конференции отобрал восемь докладов, анонсами которых мы хотели бы поделиться с читателями нашего блога. В этой статье мы расскажем о четырех докладах из запланированных восьми — продолжение последует позднее. Каждый анонс сопровождается комментарием участника программного комитета.

Итак, начнем

+13

Siphon 23 апр 2024 в 11:15

Временное хранилище данных на Apache Druid: почему это эффективно сработало для загрузки табличных файлов

Простой

7 мин

6.6K

Python * Apache * Хранение данных * Data Engineering *

Из песочницы

Всем привет! Меня зовут Амир, я Data Engineer в компании «ДЮК Технологии». Расскажу, как мы спроектировали и реализовали на Apache Druid хранилище разрозненных табличных данных.

В статье опишу, почему для реализации проекта мы выбрали именно Apache Druid, с какими особенностями реализации столкнулись, как сравнивали методы реализации датасорсов.

badcasedaily1 23 апр 2024 в 09:41

Разбираемся в ROC и AUC

Простой

6 мин

105K

Блог компании OTUSPython * Программирование * Машинное обучение *

Обзор

Привет, Хабр!

В машинном обучение очень важны метрики оценки эффективности моделей. Среди таких метрик есть: кривые ROC и показатель AUC. Они позволяют оценивать бинарные классификаторы.

В этой статье мы как раз и разберем их.

wanga1712 23 апр 2024 в 07:16

Автоматизация скачивания документов из контрактов с площадки ЕИС при помощи Python

Средний

3 мин

2.3K

Python *

Из песочницы

В настоящее время информация о государственных контрактах является важным ресурсом для многих исследований и аналитических работ. Однако сбор этой информации может быть трудоемким процессом, особенно когда речь идет о большом количестве контрактов. В этой статье мы рассмотрим, как можно использовать язык программирования Python и некоторые его библиотеки для автоматизации процесса скачивания документов из государственных закупок, а также как логировать исключения с помощью библиотеки Loguru.