Пишем свой voice-to-text на Python: 4 бэкенда и батч-обработка голосовых
От голосовых на 5 минут к тексту за 30 секунд: инструмент для батч-расшифровки голосовых: от локального Whisper до бесплатного Groq API, с автоопределением форматов и CLI

Высокоуровневый язык программирования
От голосовых на 5 минут к тексту за 30 секунд: инструмент для батч-расшифровки голосовых: от локального Whisper до бесплатного Groq API, с автоопределением форматов и CLI

Как менялся сон моих детей: анализ 5 лет накопленных данных
За 5 лет жена скрупулезно записывала сон наших дочерей. Я взял эти данные и проанализировал: как меняется сон с возрастом, сколько спят дети на самом деле, и правда ли нормы ВОЗ работают.
Оказалось, что наши дети спят по-разному, но оба — в пределах нормы. И даже в одинаковом возрасте их паттерны сна удивительно похожи!
В статье: 📈 графики, 📊 статистика и главный вывод для родителей.
#анализданных #родительство #детскийсон #python #датасаенс

Я веду семинары по машинному обучению на ФКН ВШЭ. Чтобы понять, как работает градиентный спуск, нужно написать его руками.
И вот тут начинается проблема. Классический формат семинара: я стою перед аудиторией, пишу код, объясняю. Студенты смотрят. Кто-то конспектирует, кто-то фотографирует экран. Но не делает.
Мне хотелось, чтобы семинар был не демонстрацией, а совместным экспериментом. Чтобы я показывал идею, а студенты тут же пробовали: меняли параметры, ломали код, смотрели что получится. В том же ноутбуке, в реальном времени.

Alibaba Cloud Model Studio (Сингапурский регион) даёт бесплатную квоту новым пользователям: 1 000 000 токенов на каждую модель. Не на аккаунт, а именно на каждую модель отдельно. То есть вы получаете по миллиону на Qwen-Max, Qwen-Plus, Qwen-Flash, Qwen3-Coder-Plus и так далее — параллельно.
Квота действует 90 дней с момента активации.
Что доступно
Полная линейка Qwen3:
Qwen-Max — флагман, сложные multi-step задачи, контекст 32K
Qwen-Plus — баланс качества и скорости, контекст до 1M токенов
Qwen-Flash — быстрая и дешёвая, тоже до 1M контекста
Qwen3-Coder-Plus/Flash — специализированные для кода, контекст до 1M
Qwen-VL — мультимодальные (текст + изображения)
Qwen-OCR — извлечение текста из изображений, поддержка русского
Qwen-Omni — аудио, видео, мультимодальность
Плюс открытые модели (qwen3-235b-a22b и другие) тоже доступны через API с квотой.

Играть в игры весело, а ещё веселее их разрабатывать!
Сегодня мы создадим простейшую игру для Telegram, представляющую собой Mini App.
В нашем случае, это игра с «бизнес-уклоном». Часто клиенты хотят бонус, но раздавать по запросу бонусы не очень правильно. Гораздо лучше, чтобы пользователи его «заработали», выполнив какие-то действия, взаимодействуя с вашим брендом. А что может быть веселее небольшой игры с призом в конце.
В нашей игре нужно будет прыгать по платформам и собирать звёзды.
Ссылка на игру – вы можете пройти её сами.

Когда данных мало, а домен сильно отличается, предобученные модели перестают работать.
Я попробовал вместо сбора и ручной разметки генерировать дорожные дефекты поверх реальных кадров.
Что получилось, где работает, где нет и сколько это стоит - в статье.

В этом учебном году в нашей школе внедрили новый электронный дневник. Дизайн в стиле «привет из 2010-го», медленная загрузка — типичный набор для регионального госсектора. Глядя на всё это, я подумал: если визуальная часть сделана так лениво, то что же там под капотом?
Моё любопытство было вознаграждено сполна. Внутри мобильного приложения обнаружились: отладочные логи, пишущие сессионные куки в открытый доступ, самописная «криптография» на базе XOR, неиспользуемые фрагменты AES и вишенка на торте — захардкоженная в коде универсальная заглушка для авторизации, которую разработчики, видимо, забыли вырезать после тестов.
В этой статье я расскажу, как декомпиляция APK, USB-отладка и пара скриптов на Python помогли мне обойти защиту системы, написать собственного Telegram-бота для получения оценок и в очередной раз доказать, что концепция «Security through obscurity» не работает, если за дело берется школьник с JADX.
В программе:
Перехватываем X1_SSO через adb logcat.
Реверсим класс Crypt и реализуем его логику на Python.
Ищем загадочный pdakey и находим «магическую» строку 000xpda.
Пишем бота, который работает быстрее официального приложения.

Пока работал над флоу в статье, заметил, что некоторое количество просадок в производительности при работе с агентом вне режима авто-пилота возникает из-за тихих ожиданий. Например, ты не смотришь в IDE, читаешь что-то, а Claude Code сидит тебя ждет. Особенно это надоедает, когда агенту нужно какое-то разрешение.
Я люблю и практикую ChatOps. Поэтому решение пришло само: пусть агент мне пишет в телеге, когда я ему нужен.

Решил немного изучить рынок аренды жилья в городе Санкт-Петербург.
Что сейчас по ценам, где и какие квартиры дешевле или дороже?
Данные: ЦИАН, 7 038 объявлений (цены предложения, не сделки). База - медиана, чтобы не искажаться хвостом.
В итоге собрал вот такой PDF-отчет за январь 2026 (яндекс диск).

Здравствуйте, коллеги программисты!
Большинство фейлов в CI — это мелочи: забытый console.log, форматирование, линт, сломанный импорт, файл без теста. Такие ошибки не должны доезжать до сборки или код-ревью.
Git-хуки позволяют запускать проверки прямо во время git commit и блокировать коммит, если были обнаружены нарушения.
В прошлой статье я рассказывал про скрипты, которые я использую для проверки качества кода в PHP/Laravel.
В этой статье я хочу рассказать о скриптах для JavaScript/TypeScript и Python — линтинг, форматирование, тесты, статический анализ и проверка наличия тестов.
Все скрипты, описанные в статье, находятся здесь.

Как устроены биржи? Откуда берется рыночная цена и чем лимитный ордер отличается от рыночного? Что такое стакан, спред, bid и offer? Разберемся на Python

В Python разработчик редко задумывается об освобождении памяти. Объекты создаются, используются и будто бы исчезают сами. Это создает ощущение, что памятью «занимается Python», и на этом можно не фокусироваться. На практике понимание того, как именно работает сборка мусора, помогает писать более стабильный, предсказуемый и эффективный код.

В момент выхода протокола MCP нас очень заинтересовали его возможности. Нам хотелось использовать этот протокол для того, чтобы внутренние пользователи могли обращаться к базе данных в свободной форме и получать данные в течение нескольких минут. MCP для этого выглядел очень хорошо: пользователь может сформировать запрос на удобном для него языке, а LLM поймет, что нужно сделать и сделает это.
На первый взгляд MCP в связке с LLM полностью закрывал данные проблемы, однако с ростом объема данных стало заметно, что LLM не удается обрабатывать их быстро и качественно, а написание SQL запросов для нее не всегда легкая задача (даже если примеры этих запросов у нее есть в промпте). В итоге мы получили потерю контроля над контекстом модели и непредсказуемый результат.
В этой части я расскажу про интеграцию с Open WebUI и какая архитектура модели позволила победить вышеуказанные проблемы. Следующие статьи расскажут о реализации MCP таким, каким он позволяет выполнять наши задачи (но не финальной версии). Эта статья может быть полезна всем, кто строит свои модели на основе Open WebUI или еще только выбирает фреймворк, на котором предстоит строить будущую модель

tl dr:
• итеративный constitution.md
• промтинг фич с помощью md-файлов
• модификация скриптов speckit
• ChatOps с уведомлениями в Telegram
• git-ветки для контроля урона
• вычитка документации вручную
• авто-кодинг с код-ревью финального mr.
На скрине случайно получившаяся сегодня гармоничная композиция из того, чем себя можно занять, пока агент в IDE коптит.
Привет, Хабр. Я Вадим, QA-инженер.
Все мы знаем, как работает найм. Твое резюме может быть идеальным, но если в нем нет нужного ключевого слова или оно не понравилось алгоритму первичного отсева (ATS) — ты в пролете.
Я решил взломать эту систему. Инженерно.
Я написал софт, который берет на себя весь цикл: мониторинг вакансий, анализ требований и генерацию сопроводительного письма, которое должно продать меня лучше, чем я сам.
Ниже — краткий лог разработки: как мы боролись с «машинным акцентом», почему нейросети врут про опыт и удалось ли мне обмануть рекрутеров.

Каждый разработчик рано или поздно упирается в парадокс: чтобы расти и развивать продукт, нужно показывать код, но показывать его страшно. Разбираемся, откуда берется этот барьер и как построить процесс публикации так, чтобы спать спокойно.
Современные WAF — это крепости, которые открывают ворота любому, кто знает секретное рукопожатие. Я переписал свой Red Team сканер с Python на Go и обнаружил, что топовые защиты сдаются и отдают бинарные данные, принимая бота за легитимный браузер. История о том, как uTLS и правильный ClientHello ломают логику "защитников". Код, бенчмарки и (конечно) тесты, проведенные строго на внутренних полигонах.

Если ваш API-клиент выглядит как башня декораторов — вы уже в зоне инженерной боли. Рассказываю, как я из этого выбрался.

Claude AI + Python + pandas = экономия 85% времени. Полный разбор архитектуры, кода и подводных камней.

Представьте: вы скидываете нейросети скриншот сложной программы (будь то Cinema 4D, Excel или 1С) и говорите: «Сделай мне вот это». И через секунду мышка на вашем экране начинает сама летать по кнопкам, выполняя работу за вас.
Это не магия и не дорогой корпоративный софт. Это AI Bridge — микро-утилита на Python, которую можно запустить за минуту.