Все потоки

Python *

Высокоуровневый язык программирования

734,6

Рейтинг

СтатьиПостыНовостиАвторыКомпании

tagir_analyzes 25 мар в 10:24

От 0.034 до 0.791 и обратно: Legal RAG, 17 итераций и стена масштабирования

Средний

22 мин

7K

Искусственный интеллектМашинное обучение * Natural Language Processing * Python * Data Engineering *

Кейс

Я участвовал в ARLC 2026 — юридическом AI-челлендже по построению RAG-пайплайна поверх корпуса судебных решений и законов. Соло, с Claude Code в качестве напарника. За 5 дней и 17 итераций прошёл путь от 0.034 до 0.791 на warmup — а потом вышел в финал и потерял 42% на 300 документах вместо 30. Внутри — архитектура, код, математика F-beta, три провала и честный разбор работы с AI-ассистентом.

Читать далее

+11

formeo 25 мар в 05:37

От «Долгого Джонта» Кинга до pip install: пишем HAL для атомного манипулятора

Средний

5 мин

6.6K

Научно-популярноеPython * Open source *

Начал с фантазий про телепортацию из рассказа Кинга, закончил Python-пакетом для управления атомным микроскопом. Симулятор вместо оборудования за $500K, замена LabVIEW на asyncio, drop-in для RL-агента.

Читать далее

+4

AlekseiVB 25 мар в 04:10

Часть 5: Интеграция с устройствами «Умного дома» — от модели к реальному устройству

Сложный

8 мин

7.1K

Умный домПроектирование и рефакторинг * Python * Машинное обучение *

Обзор

Что сработало хорошо

MQTT — надёжный и простой протокол для умного дома

Плагин-архитектура — легко добавлять новые устройства

Обработка ошибок — система устойчива к сбоям

Очередь команд — предотвращает конфликты

Что можно улучшить

Поддержка больше протоколов — Zigbee, Z-Wave, Matter

Голосовая обратная связь — подтверждение команд голосом

Сценарии — поддержка сложных сценариев (макросов)

Машинное обучение — адаптация под привычки пользователя

Советы для разработчиков

Начинайте с простого — начните с одного устройства, затем масштабируйте

Тестируйте надёжность — тестируйте в реальных условиях

Обрабатывайте ошибки — устройства могут быть недоступны

Документируйте API — облегчает добавление новых устройств

Читать далее

+1

Choose_Goose 25 мар в 03:16

Pygame (Урок № 1)

Средний

19 мин

6.2K

Python * Игры и игровые консолиРазработка игр *

Туториал

Из песочницы

В языке Python значительная часть практической работы выполняется не только средствами самого языка, но и с использованием библиотек. Библиотекой называется набор готовых программных средств: функций, классов, методов и модулей, предназначенных для решения определённого круга задач. В случае Pygame таким кругом задач являются создание оконных приложений, обработка действий пользователя, вывод графики, работа со временем, звуком и текстом.

Читать далее

0

GoldenGekko 24 мар в 19:36

Векторный поиск в PostgreSQL: pgvector, pgvectorscale или VectorChord?

Простой

15 мин

7.7K

Python * PostgreSQL *

Привет Хабр! Меня зовут Владимир сегодня я постараюсь исправить ошибку из моей первой статьи про векторный поиск. Основная претензия к статье (два из трех комментариев 😂) была в том, что тема ~~сисек~~ векторного поиска не раскрыта.

В этом материале постараюсь кратко рассказать, что же такое векторный поиск, зачем он нужен, варианты реализации векторного поиска в PostgreSQL и провести сравнительные тесты времени отклика при различных объёмах данных.

Читать далее

+5

Razor00913 24 мар в 14:49

Развиваем проект: фильтрация, поиск и экспорт данных

Средний

24 мин

7.1K

Python * Программирование *

Туториал

В прошлой части мы превратили простое приложение для заметок в удобный инструмент с цветовой индикацией, сортировкой и возможностью редактирования. Однако, когда задач становится много, даже самый красивый список может превратиться в нечитаемую ленту. Согласитесь, сложно ориентироваться, когда нужно найти одну важную задачу среди сотни выполненных.
В этой статье мы добавим инструменты профессионального управления:

Читать далее

0

spbmolot 24 мар в 13:00

Open-source персистентная память для LLM

Средний

6 мин

9.3K

Машинное обучение * Python * Open source * Искусственный интеллект

Кейс

Задача, которая казалась тривиальной: научить LLM помнить, с кем она разговаривает. Пользователь пишет «я вегетарианец», а через три сообщения модель предлагает стейк-хаус. Знакомо?
Стандартные решения — обрезка истории, суммаризация, внешние векторные базы — всё это костыли. Я пошёл другим путём и сделал NGT Memory — модуль персистентной памяти с открытым исходным кодом.
В статье подробно расскажу про архитектуру, эксперименты и все найденные решения. Если строили чат-ботов или AI-агентов — будет интересно

Читать далее

+14

inkedsymon 24 мар в 09:17

В каждом JPEG зашита модель вашей сетчатки. Буквально

Простой

8 мин

48K

Алгоритмы * Обработка изображений * Научно-популярноеСжатие данных * Python *

Обзор

После того как я написал статью про то, что ваш монитор не умеет показывать бирюзовый и 65% видимых цветов для него просто не существуют, один мой знакомый (далекий правда от технической отрасли) спросил: «Окей, монитор врёт, а что тогда делает JPEG с оставшимися 35%?» И это хороший вопрос. Я полез в спеку, а через полчаса забыл, зачем вообще полез. Потому меня уже интересовало другое: ребята, которые в 1992-м финализировали этот стандарт, по сути заревёрсили человеческое зрение и запихнули его в алгоритм сжатия.

И я хочу вам про это рассказать, потому что это самый красивый кусок инженерии, который я видел. В той статье я разбирал, как мало мы на самом деле видим. Здесь — как мало нам на самом деле нужно видеть, чтобы мозг поверил, что видит всё. А потом я решил это проверить руками.

Читать далее

+223

mozzalerra 24 мар в 09:00

Бот для отправки графиков из Redash в Mattermost

Простой

4 мин

5.7K

Python * Big Data * DIY или Сделай самOpen source * Визуализация данных *

Туториал

Расскажу, как я автоматизировала регулярную отправку графиков из BI в мессенджер.

Задача была довольно типичная: есть дашборд в redash, на который смотрят каждый день. Данные иногда приходят с задержками и нельзя быть уверенным, что в 9 утра все "доедет", плюс зайти руками и прокликать несколько разрезов это долго и неудобно, хочется сразу все видеть в мессенджере как только данные обновились.

Я опишу базовые шаги, чтобы в целом дать понимание и рассказать про такую возможность, конечно, код должен дорабатываться и персонализироваться исходя из ваших задач

Читать далее

0

ester_mrt 24 мар в 07:30

GIL в Python для senior interview

Средний

14 мин

7K

Python * Программирование * Параллельное программирование *

Туториал

GIL — самая известная «фича» Python, о которой большинство разработчиков знают ровно одну фразу: «мешает многопоточности». Этого хватает для джуна, но не для сеньора.

Статья построена так, чтобы после её прочтения вы могли не только ответить на вопросы по GIL на senior-интервью, но и объяснить коллеге-стажеру, что происходит внутри интерпретатора, когда два потока пытаются одновременно изменить один список.

Читать далее

+9

mariakasimceva 23 мар в 22:49

Когда CUPED не хватает: где помогает VWE

Средний

4 мин

5.8K

Python * $mol *

Когда A/B-тест не показывает эффект, это не всегда значит, что эффекта нет. Иногда он просто теряется в шуме метрики.

В таких случаях обычно делают одно из трёх: увеличивают трафик, продлевают эксперимент или признают, что продуктовый эффект слишком слабый. Но есть и четвёртый путь — уменьшить дисперсию оценки. Для этого часто используют CUPED. Реже — VWE. И ещё реже обсуждают, что эти методы борются с разными источниками шума.

Код, графики и все результаты симуляции — в открытом репозитории.

Ниже разобраны две простые идеи:

Читать далее

0

abdullin-rail 23 мар в 19:15

Оптимизация сборки Python Docker образа: размер меньше на -43% (-57%)

Средний

8 мин

10K

DevOps * Python * Серверная оптимизация *

Туториал

Из песочницы

Всем привет. Я Backend разработчик, в основном на Python и немного Go. Хотел бы рассказать про свой опыт оптимизации docker образов и написать некий «туториал». Он скорее будет полезен для разработчиков или начинающим DevOps. Для опытных DevOps инженеров, возможно будет мало интересного и полезного.

Читать далее

+4

negrbluad 23 мар в 17:01

Автоматический поиск торговых сигналов с отправкой в Telegram: полный разбор Python-системы

Средний

8 мин

7.3K

Финансы в ITPython * Визуализация данных * Открытые данные * Криптовалюты

Туториал

Алготрейдинг давно вышел за пределы простых индикаторов и пересечений скользящих средних. Современные подходы опираются на анализ ликвидности, зон спроса и предложения, поведения цены внутри этих зон и реакции на них.

В этой статье разбирается полностью автоматизированная система, которая:

Читать далее

+3

NGdust 23 мар в 11:45

Идемпотентность в backend: как перестать дублировать операции

Простой

10 мин

7.1K

Python * IT-стандарты * PostgreSQL * Программирование * Анализ и проектирование систем *

Из песочницы

Вы когда-нибудь получали два списания с карты за одну покупку? Или видели дважды созданный заказ после одного клика? Это не баг платёжной системы - это баг вашего кода. Имя этому баг - отсутствие идемпотентности.

Читать далее

-1

ph_piter 23 мар в 10:56

Поиск с возвратом

6 мин

6K

Блог компании Издательский дом «Питер»Профессиональная литература * Python * Интервью

Привет, Хаброжители! Представьте, что вы находитесь на перекрестке в лабиринте и знаете, что один из трех маршрутов впереди ведет к выходу.

Читать далее

+6

tochno_st 23 мар в 09:16

Гайд: Как работать с форматом PARQUET

Простой

9 мин

6.5K

Python * Открытые данные * Сжатие данных *

Туториал

Из песочницы

В прошлом году мы начали публиковать данные в каталоге «Если быть точным» в формате Parquet. Его придумали инженеры Twitter и Cloudera в 2013 году, и сегодня он стал стандартом хранения аналитических данных — его используют Google, Amazon, Netflix и большинство современных data-платформ. В этом гайде мы расскажем, как эффективно работать с данными в формате Parquet с помощью Python.

Читать далее

+5

husky_it 23 мар в 09:00

Как применяют LLM с RAG в экосистеме ML-моделей поддержки Лемана Тех? Кейс

12 мин

5.9K

Блог компании Конференции Олега Бунина (Онтико)Блог компании Лемана ТехPython * Искусственный интеллектData Engineering *

Кейс

С ростом числа обращений в Service Desk классические ML-решения перестали покрывать все сценарии. Что же с этим делать?

Привет, Хабр! Я — Дмитрий Терентьев, ведущий специалист по науке о данных в Центре компетенций сопровождения IT-продуктов. Работаю с данными больше восьми лет, последние четыре — в Лемана Тех. В этой статье по мотивам доклада с AiConf я расскажу об эволюции моделей машинного обучения в поддержке и как удалось дополнить экосистему поддержки LLM с RAG для человекообразных ответов по Wiki и интеллектуальной эскалации к живым специалистам.

Читать далее

+3

Sherstpasha 23 мар в 08:18

Базовый минимум. Часть 4: ИИ-агенты

Простой

11 мин

15K

Natural Language Processing * Научно-популярноеИскусственный интеллектPython * Машинное обучение *

Туториал

Большая языковая модель хорошо отвечает на запросы, но во многих практических задачах одного ответа уже недостаточно. Нужно не просто сгенерировать текст, а выполнить последовательность шагов: получить данные, выбрать инструмент, проверить результат и при необходимости скорректировать действие. Именно поэтому агентный подход быстро становится стандартом современных систем на основе LLM.

В четвертой, завершающей части серии «Базовый минимум» разбирается, что такое ИИ-агенты, чем они отличаются от RAG-систем, как работает ReAct и зачем нужны мультиагентные системы. В конце будет показан простой воспроизводимый пример минимального ИИ-агента-помощника в путешествиях в Google Colab.

Читать далее

+14

Eco_coder 23 мар в 07:21

Зачем Паустовскому облака? Узнал точно с помощью Python

Простой

6 мин

8K

Python * Научно-популярноеЧитальный залВизуализация данных * Занимательные задачки

Аналитика

Константина Паустовского называют мастером пейзажной лирики. В его произведениях природа действительно выступает не как фон событий, а как будто один из полноценных действующий персонажей. Мне стало интересно попробовать разобраться, за счет каких лексических средств писатель так здорово оперирует впечатлениями читателя.

Читать далее

+1

select_zvezdo4ka_from 23 мар в 06:43

Apache Superset — боремся с фильтрами по дате. Часть 1

Простой

4 мин

6.2K

Apache * Визуализация данных * Big Data * Python * SQL *

Туториал

В этой статье хотелось бы начать раскрытие больной для многих пользователей Apache Superset темы — фильтры по дате. Начнем с малого: как суперсет выбирает колонку даты; как выбрать желаемую колонку вместо той, которую он выбирает; каким образом это реализовано; какие баги породили этим решением; почему КОП не доведет до добра.

Читать далее

0

3

4 5 ...