Все потоки

Python *

Высокоуровневый язык программирования

784,71

Рейтинг

СтатьиПостыНовостиАвторыКомпании

Flayt_334 4 июл 2025 в 06:16

Как я создал формат изображений на уровне png в 16 лет

4 мин

7K

Из песочницы

Всем привет, я разработал формат изображений.pi.

мы привыкли к JPEG, PNG, PSD — форматам, которые годами хранят наши изображения. Но что, если я скажу, что файл может быть не просто статичным контейнером пикселей, а манифестом динамического процесса? Что, если он сам умеет эффективно работать с гигантскими данными, подтягивать контент извне и хранить всю свою историю изменений?

Мне 16 лет. Весь этот проект, который я сейчас представлю, был создан, отлажен и протестирован на слабом устройстве

Сегодня я хочу рассказать о PIX (Pixel Scene) Format v16.0 — эволюции моего собственного бинарного формата изображений, который теперь способен на то, о чем большинство «популярных» форматов могут только мечтать.

Что такое PIX v16.0 и чем он отличается от того, что вы привыкли видеть?

Читать далее

+5

Litlmidl 2 июл 2025 в 05:15

Обновление MikroTik по SSH: Python-скрипт с автоматическим RouterBOARD upgrade

Средний

2 мин

6.2K

Сетевые технологии * Python * Системное администрирование *

Из песочницы

Обновление MikroTik — та ещё боль. То не влезешь по SSH, то забыл сделать routerboard upgrade, то устройство «уходит в себя» и не возвращается. Особенно, когда устройств не одно, а десятки. Вручную это превращается в спорт на выносливость и крепкие нервы.

Я решил, что хватит. Написал скрипт на Python, который делает всю грязную работу за меня: подключается, проверяет обновления, ставит новые пакеты, делает routerboard upgrade и даже ждёт, пока устройство снова появится в сети. Главное — всё логируется и работает аккуратно, как системный администратор в хорошем настроении.

В этой статье:

Читать далее

+5

Albertino_S 1 июл 2025 в 10:16

Классификация документов: гайд для обхода граблей

Средний

3 мин

2.7K

Python * Машинное обучение *

Из песочницы

У всех на слуху библейское изречение «отделять зерна от плевел» и его грубый аналог «отделять мух от котлет». В обычной жизни мы также сталкиваемся с необходимостью разделять схожие предметы. В машинном обучении задача разделить объекты по определенным классам, например, «зерна» и «плевелы», называется классификация. Классификация лежит в основе современных технологий искусственного интеллекта и играет ключевую роль в машинном обучении.

Читать далее

+5

badcasedaily1 30 июн 2025 в 08:43

weakref.finalize: «почти IDisposable» для Python-объектов

Простой

7 мин

1.2K

Блог компании OTUSPython * Программирование *

Обзор

Привет, Хабр!

Я не знаю, как у вас, а у меня перед глазами все еще маячат толстенные исходники WinForms-эра на C#, где любой порядочный объект, умеющий держать ручку к файлу или сокету, строго реализует IDisposable. Закрыл — молодец, забыл — получи warning от IDE и пару нехороших утечек в production.

В Python, увы-ях, аналогичный контракт традиционно строили на del и контекст-менеджерах. Первый: если объект в циклическом мусоре, финализатор может не вызваться вообще; к тому же при выключении интерпретатора порядок разрушения объектов хаотичен. Второй (with ... as) шикарен, но требует явного вызова, а значит — дисциплины.

С выходом PEP 442 и появлением weakref.finalize мы получили «почти IDisposable» — финализатор, которому не страшны циклы, и который честно отработает даже на shutdown, если правильно обращаться.

Читать далее

+5

inigomontoya722 20 июн 2025 в 19:01

Разработка LLM моделей для обновления кода приложений на более высокие версии фреймворков или языков программирования

Простой

12 мин

4.9K

JavaScript * Python * Машинное обучение * Искусственный интеллект

Из песочницы

В этой статье я планирую исследовать, как можно использовать большие языковые модели (LLM) для миграции проектов между различными фреймворками. Применение LLM в задачах на уровне репозитория — это развивающаяся и всё более популярная область. Миграция кода со старых, устаревших фреймворков на новые является одной из ключевых задач в крупных корпоративных проектах.

Читать далее

+5

Andrey_Biryukov 19 июн 2025 в 09:22

Линейная регрессия в ML для самых маленьких

Простой

13 мин

20K

Блог компании OTUSPython * Машинное обучение *

Перевод

В мире машинного обучения есть много всего интересного, но тем, кто только начинает свой путь в этой области часто бывает многое непонятно. В этой статье мы попробуем разобраться с линейной регрессией.

Линейная регрессия — это статистический метод, используемый для моделирования взаимосвязи между зависимой переменной и одной или несколькими независимыми переменными. Проще говоря, он помогает понять, как изменение одного или нескольких предикторов (независимых переменных) влияет на результат (зависимую переменную). Подумайте об этом, как о проведении прямой линии через диаграмму рассеяния точек данных, которая наилучшим образом отражает связь между этими точками.

Читать далее

+5

Oncenweek 18 июн 2025 в 09:15

Пишем аддон для Fusion 360

Простой

12 мин

2.8K

CAD/CAM * DIY или Сделай самPython *

Из песочницы

Иногда есть необходимость создать расширение для САПР, которое будет генерировать модель по заданным параметрам. Статья на примере создания расширения для генерации волновых передач с промежуточными телами качения показывает, как можно это сделать в САПР Fusion 360.

Читать далее

+5

MaxRokatansky 17 июн 2025 в 12:39

5 техник, применяемых в анализе временных рядов, которые должен знать каждый. Часть 1

Простой

9 мин

15K

Блог компании OTUSМашинное обучение * Big Data * Python * Визуализация данных *

Перевод

В этом руководстве мы будем разбираться, как повысить качество прогнозирования с помощью машинного обучения, используя точные методы разделения данных, перекрестную проверку временных рядов, конструирование признаков и многое другое.

Читать далее

+5

Viacheslav-hub 13 июн 2025 в 07:00

Создаем свой RAG: от загрузки данных до генерации ответов с LangGraph. Часть 2

Средний

7 мин

14K

Python * Искусственный интеллектПрограммирование *

Туториал

Привет, Хабр!

Технология RAG (Retrieval-Augmented Generation) сочетает поиск информации с генерацией ответов, делая AI-системы более точными и осмысленными. В этой статье разберём практическую реализацию RAG с помощью LangGraph — гибкого инструмента для построения агентов и графов.

Читать далее

+5

tretiakov_dm 2 июн 2025 в 11:40

Spark on Kubernetes: наш путь к автоматизации через кастомный оператор Airflow

Средний

7 мин

4.7K

Блог компании Lenta techBig Data * Data Engineering * Data Mining * Python *

Кейс

Всем привет! Меня зовут Дмитрий Третьяков, я ML Engineer в компании «Лента». Мы регулярно запускаем PySpark-приложения в Kubernetes-кластере, используя Airflow. Этот процесс важен для нашей ежедневной работы с данными, но в какой-то момент мы столкнулись с тем, что стандартный подход через SparkKubernetesOperator стал сдерживать развитие: не хватало гибкости, возникали сложности в сопровождении и процесс настройки был излишне сложным для разработчиков.

Читать далее

+5

badcasedaily1 31 мая 2025 в 10:03

Что может пойти не так с merge() — дубли, потери, ошибки типов

Простой

5 мин

4.3K

Блог компании OTUSПрограммирование * Python *

Обзор

Привет, Хабр!

Тонкое скрещивание DataFrame-ов в pandas по-прежнему остаётся источником прелестных багов: случайных дубликатов, потерянных строк и неуловимых NaN-ов. В статье рассмотрим эти проблемы.

Читать далее

+5

dv1555 30 мая 2025 в 05:54

Пример офлайн/онлайн инвентаризации на SimpleUI/1C как демонстрация новых возможностей платформы в 2025 году

Средний

13 мин

3.2K

1С * Android * Python * Разработка мобильных приложений *

Туториал

Пример такой:

Сквозной пример с пошаговым разбором решения на фреймворке SimpleUI для Android совместно с 1С: оффлайновая работа с инвентаризацией, загрузка/выгрузка товаров и документов из 1С и результатов инвентаризации обратно в 1С, CV-возможности ActiveCV. Демонстрация новых механизмов SimpleUI и актуальных подходов к разработке в 2025 году.

Читать далее

+5

Parampaika 28 мая 2025 в 16:34

Анализ и прогнозирование погодных условий

Простой

9 мин

2.7K

Python * PostgreSQL *

Из песочницы

Настоящее исследование посвящено комплексному анализу глобальных климатических изменений на основе исторических метеорологических данных за период с 1950 по 2024 год. Мы фокусируемся на шести ключевых странах, представляющих основные климатические зоны планеты.

Читать далее

+5

igumnov 27 мая 2025 в 09:53

Генерация карт Таро при помощи OpenAI модели GPT-Image-1

3 мин

6K

Искусственный интеллектPython * Графический дизайн *

Я решил сделать уникальную колоду карт Таро. Заказывать их у фриланс-художников дорого: каждая карта стоит от 5 USD, так что для полной колоды из 78 карт это выходит 390 USD. Перебрав разные генераторы изображений, я остановился на модели GPT-Image-1 от OpenAI, поскольку она выдаёт максимальное качество и минимальный процент ошибок. В среднем генерация одной карты занимает около минуты. Создание одной колоды обошлось мне в $25. В итоге я сгенерировал три колоды с уникальными стилями и потратил на это в общей сложности 75 USD.

Читать далее

+5

Dmytro_Kikot 23 мая 2025 в 07:00

Молекулярное шифрование: полимерный пароль

17 мин

2.3K

Блог компании ua-hosting.companyPython * Криптография * Научно-популярноеХимия

Неустанно растущий объем информации требует создания новых носителей. Данная потребность уже давно привела к тому, что ученые с особым интересом рассматривают ДНК в качестве идеального (по мнению многих) носителя информации. Проблема в том, что доступ к данным на молекулах является крайне сложным, дорогим и длительным процессом. Ученые из Техасского университета в Остине (США) разработали новый метод кодирования информации в синтетических молекулах, который может сталь более выгодной и эффективной альтернативой биомолекул. Как именно работает данный метод, что лежит в его основе, и что удалось с его помощью сделать? Ответы на эти вопросы мы найдем в докладе ученых.

Читать дальше →

+5

VasiliyS178 22 мая 2025 в 13:18

Повышаем эффективность хранения данных до 300 раз с помощью таблиц SCD-2

Простой

14 мин

7.8K

Блог компании X5 TechPython * Алгоритмы * Хранение данных * Data Engineering *

Туториал

✏️ Технотекст 8

Всем привет, меня зовут Василий. С 2021 года работаю в роли инженера данных в Х5 Tech, успел за это время познакомиться с несколькими интересными проектами и подходами в области обработки данных, об одном из которых пойдет речь далее.

В этой статье расскажу о том, как можно повысить эффективность хранения данных за счет уменьшения их дублирования.

Разберем, что из себя представляют Slowly Changing Dimensions-2 (далее SCD-2) таблицы и самостоятельно реализуем на PySpark алгоритм сохранения данных в них. Попутно поговорим о том, как находить изменения в любой таблице, даже если отсутствуют поля для выбора изменившихся записей, и научимся получать из созданной SCD-2 таблицы срезы на требуемую дату в прошлом.

Читать далее

+5

evgeniievstafev 15 мая 2025 в 08:16

Полмиллиона запросов за месяц: мой LLM-challenge и первые выводы

Простой

3 мин

13K

Python * JavaScript * Open source *

Из песочницы

Привет, Хабр! Меня зовут Евгений, я работаю разработчиком в Университете Кембриджа (UK). В начале апреля я запустил llm7.io - полностью бесплатный LLM-провайдер, совместимый с популярными библиотеками chat completion. Цель была простая: проверить, насколько эффективно можно построить отказоустойчивую архитектуру под настоящую high-load-нагрузку, и при этом дать всем желающим доступ к мощным языковым моделям - без регистрации, API-токенов, смс и прочих барьеров.

Что произошло за месяц?

+5

sergey-akhmineev 6 мая 2025 в 02:10

Webhook у Harbor или как я оповещения о пушах docker images нашей команды делал часть — 1

Простой

4 мин

2.2K

Open source * Проектирование API * GitHub * Python *

Туториал

Сезон Open source

Руководителям групп разработки и членам команды часто приходится сталкиваться с проблемой информирования коллег о новых версиях docker image внутренних инструментов. Сообщения в общих чатах не всегда эффективны, а писать вручную — не лучшая практика. И тут мы рассмотрим разработку решения по автоматическому информированию.

Читать далее

+5

BAHOO 3 мая 2025 в 15:27

База для старта разработки первого AI-агента

Простой

8 мин

12K

Туториал

Хотите создать своего AI-агента, но не знаете, с чего начать? Эта статья даст вам необходимый минимум для разработки автономного помощника, способного понимать задачи, принимать решения и взаимодействовать с внешними сервисами.

AI-агенты — это умные программы на основе языковых моделей (LLM), которые не просто отвечают на вопросы, но и автоматизируют действия: ищут информацию, управляют приложениями или выполняют задачи по заданным правилам.

Мы разберём создание такого агента шаг за шагом на примере GigaChat API. Выбор пал на GigaChat из-за простоты его использования для пользователей из РФ и в случае необходимости переписать на другую llm не составит труда.

Читать далее

+5

Markus_automation 13 апр 2025 в 20:01

Рабочий чекер, попал ли ваш сайт под фильтр Гугл — бесплатно

Простой

9 мин

3K

Веб-аналитика * Google Cloud Platform * Google API * Python *

Туториал

Понадобилось мне проанализировать сайт на предмет попадания его под фильтр Гугла, причем с историческими данными.

Первым делом начал гуглить - чекер фильтров Гугла и вот это вот все. Естественно - в интернетах куча решений, но есть небольшое но... Они либо платные, либо условно-бесплатные, либо вообще непонятно как работают.

Ну что делать - надо реализовать собственное решение, что я и сделал.

Палю годноту, так как использование этого решения никак не повлияет на мою деятельность, а кому то может и полезно будет.

Суть решения достаточно проста есть код (он будет ниже), написанный на Python. Он реализует интерактивный дашборд для визуализации данных, полученных из Google Search Console, с использованием библиотеки Dash (на базе Plotly) для построения графиков.

Читать далее

+5

1 2 ...

54

55 56 ...