Python *

Высокоуровневый язык программирования

659,51

Рейтинг

СтатьиПостыНовостиАвторыКомпании

stas-clear 6 окт 2025 в 13:33

NeuTTS Air: открытая модель синтеза речи, которая работает прямо на вашем устройстве

Средний

5 мин

9.7K

Искусственный интеллектЗвукМашинное обучение * Open source * Python *

Обзор

2 октября 2025 года компания Neuphonic представила NeuTTS Air - открытую модель преобразования текста в речь, которая кардинально меняет подход к синтезу голоса. Главная особенность в том, что она работает полностью локально на обычных устройствах без необходимости подключения к интернету или облачным сервисам.

+12

IgorAnokhin 6 окт 2025 в 10:41

Асинхронность vs. многопоточность: что выживет в эпоху No GIL?

14 мин

19K

Блог компании К2ТехОблачные сервисы * DevOps * Python * Качество кода *

Мнение

Хватит спорить — пора запускать и сравнивать.

Тестируем реальные сценарии, измеряем RPS, смотрим на потребление памяти и разбираемся, когда самая разумная стратегия — это просто подождать и обновить Python на free-threading версию.

Привет, Хабр! Меня зовут Игорь Анохин, я — руководитель платформенной разработки в K2 Cloud и более 8 лет программирую на Python.

+65

efreelancer 6 окт 2025 в 07:58

GGUF: квантизация с калибровкой (imatrix)

Средний

6 мин

Машинное обучение * Искусственный интеллектPython *

Туториал

Привет, хабровчане!

Признаюсь, я не большой любитель vLLM, Triton Inference Server и всяких там NeMo, вместо них я предпочитаю ollama вообще и llama.cpp в частности, поскольку придерживаюсь мнения, что 1-2% потери в точности и отсутствие некоторых плюшек - не так важно, по сравнению с удобством деплоя, спекулятивным декодингом, многократным приростом скорости, динамическим оффлодом в память системы и возможностью запускать модели на любом "ведре", навроде древних зионов, андройдофонов, малинок или, скажем, макбуков.

Поэтому вполне ожидаемым для меня является, когда авторы моделей заморачиваются с конвертацией оных в GGUF - особом формате сжатия весов моделей, пригодном для запуска через упомянутые выше ollama и llama.cpp.

Однако реальность обычно немного отличается от ожиданий, и конвертацию в GGUF с последующей квантизацией приходится делать самостоятельно, а чтобы качество работы модели не падало, желательно генерировать imatrix через калибровочный датасет, о чём я и хочу рассказать в данной публикации.

+12

badcasedaily1 6 окт 2025 в 07:08

Triton FP8: реализация и автотюнинг GEMM/Attention под RTX 40xx/Blackwell

Простой

20 мин

4.3K

Блог компании OTUSПрограммирование * Python * Машинное обучение *

Обзор

Привет, Хабр!

Я тут на досуге решил разобраться с 8-битными числами с плавающей запятой (FP8) и попробовать написать под них свои GPU-ядра на Triton. Зачем? Ну, новые ускорители от NVIDIA обещают невиданную ранее производительность на FP8 — вдвое больше операций, чем на FP16. Для тренировки огромных нейросетей это прям манна небесная: меньше памяти, больше скорость. Но, конечно, всё не так просто.

Сам по себе FP8 формат капризный, требует тщательного подхода: два разных варианта чисел (E4M3 и E5M2), масштабирование (скейлинг) тензоров, аккуратное накопление сумм в FP16/FP32, разбиение вычислений на тайлы под размер быстрого SRAM (shared memory) и даже специальные меры против переполнения. В общем, нюансов хватает. Расскажу, что узнал и как реализовал GEMM (умножение матриц) и внимание (Attention) в FP8 на языке Triton, да ещё и с автотюнингом.

Перейти к материалу

+14

sound_right 6 окт 2025 в 06:37

AI Review кода за 30 минут: локальная LLM прямо в CI/CD

Простой

6 мин

14K

Python * DevOps * Тестирование IT-систем * GitHub * Искусственный интеллект

Туториал

Как за полчаса подключить автоматическое ревью кода с помощью AI Review и локальной LLM Ollama прямо в CI/CD — без токенов и VPN.

+20

ya_ne_ivan 5 окт 2025 в 10:16

Паттерны программирования при работе с LLM

Средний

6 мин

11K

Искусственный интеллектМашинное обучение * Python * Natural Language Processing * Анализ и проектирование систем *

Из песочницы

LLM - мощный инструмент, но его эффективность в продакшене зависит не от одного «хитрого промпта», а от всей архитектуры: что мы даём модели, как управляем её рассуждением и как проверяем/обрабатываем результат. В этой статье - компактная карта паттернов, разбитая по этапам конвейера: Input -> Reasoning -> Output.

+20

bazhil 4 окт 2025 в 09:16

OpenSource, или как я перестал бояться и полюбил автотесты

Простой

5 мин

9.3K

Блог компании RaftPython *

Из песочницы

Всем привет! Меня зовут Илья. Я давно читаю habr, не так долго занимаюсь программированием и еще чуть меньше времени хочу написать здесь статью. Не то, чтобы это идея фикс (или hotfix), но лучше опубликоваться и жалеть, чем поставить в план на «когда-нибудь потом», ничего не сделать, и «получить за это премию». Таких задач у меня уже накопилось на несколько жизней вперед, поэтому, приняв волевое решение, я выделил время на графоманию.

В прошлом мне доводилось писать околонаучные статьи и вести блог про путешествия, совершенные в разных стадиях трезвости (на рецензируемые статьи ВАК про пьяные авантюры, к сожалению, не хватило грантов). Но поскольку срок давности по этим событиям давно прошел, а все самое значимое я забыл, то опишу свой недавний опыт, связанный с OpenSource.

Идея открытого программного обеспечения мне нравится. Люди, создающие OpenSource проекты вызывают интерес, особенно, когда их продукты востребованы и конкурентноспособны. Двигать индустрию IT в свободное от работы время, вместо того, чтобы предаваться гедонизму — достойно уважения. Особенно, когда сам активно пользуешься подобными продуктами, вместо платных аналогов или ручного труда.

+31

alizar 4 окт 2025 в 09:01

«LLVM для AI». Крис Латтнер и язык программирования Mojo

Средний

8 мин

12K

Блог компании RUVDS.comPython * Машинное обучение * Искусственный интеллектСистемное программирование *

Обзор

Крис Латтнер (Chris Lattner) — создатель CPU-компилятора LLVM и соавтор Swift — предложил новый язык программирования Mojo, спроектированный для одновременного программирования CPU, GPU и TPU (тензорные ядра, оптимизированные для матричного умножения, а это и есть инференс LLM), без всяких лишних библиотек типа CUDA, ROCm и XLA.

Mojo — это надмножество Python с производительностью С и потенциальная замена Rust. Код на нём легко переносится между различными GPU, при этом платформа Modular быстрее обновляется под новые модели GPU, чем сама Nvidia выпускает обновления для своего софта (новые attention kernels).

Простой и мощный язык для написания и деплоя LLM-приложений независимо от оборудования (AMD, Nvidia, Intel и проч.), с метапрограммированием во время компиляции и прочими штуками. Что-то вроде единой «LLVM для AI». Унифицированная программная платформа, которая запускается на любом железе. Это ещё и самый простой способ ускорить Python-приложение в 10−1000 раз, не переписывая его фрагменты на Rust или C++ (что по сути делают NumPy и PyTotch).

+51

taratorin 3 окт 2025 в 12:49

Как написать нейросеть для бизнеса на Python

12 мин

9.7K

Блог компании BotHubPython * Программирование * Искусственный интеллект

Привет, Хабр! Сегодня мы разберем, как нейросети автоматизируют рутинные безнес‑процессы на реальном примере — классификации заявок в службу поддержки. Даже простые нейросети способны значительно разгрузить сотрудников и ускорить обработку данных.

+15

mxmvshnvsk 3 окт 2025 в 09:00

Просто о сложном: архитектура фронта для техлида

Средний

14 мин

9.1K

Блог компании Конференции Олега Бунина (Онтико)C# * IT-инфраструктура * Python *

Обзор

Привет, Хабр! Меня зовут Максим Вишневский, я архитектор (в основном фронтенда) и автор небольшого Telegram-канала Вишнёвые истории. Эта статья основана на моём докладе с TeamLead Conf++ 2024.

Сегодня я проведу для вас экскурсию в мир фронтенда и немного поделюсь болями: расскажу, из чего он состоит, как работает, обсудим архитектурные проблемы и почему формочку так долго поставлять в продакшен.

+10

Athenix 1 окт 2025 в 11:02

Бэктестер для торговых стратегий на GPU со скоростью просчёта 150 тыс стратегий за 1 секунду

Средний

4 мин

11K

Алгоритмы * Финансы в ITPython *

Кейс

Хочется, чтобы фреймворк для тестирования торговых стратегий был пакетным, гибким, подбирал сразу 10 параметров и просчитывал очень быстро. И вот он ...

+18

andreyzaostrovnykh 1 окт 2025 в 07:05

Pytest. Гайд для тех, кто ни разу про него не слышал

Простой

24 мин

33K

Блог компании BegetPython * Тестирование IT-систем * Программирование *

Кейс

Недавно на работе передо мной возникла задача максимально быстро погрузиться в автоматизированное тестирование с ранее мной не использовавшимся фреймворком pytest. Почитав порядка десяти статей на Хабре я понял, что в каждой из статей есть много всего интересного, а чтобы системно погрузиться — необходимо идти читать документацию. Я решил, в привычной мне манере, разобраться и систематизировать самый сок для того, чтобы быстро въехать в суть и важные тонкости положив основу для дальнейшего использования.

Всем интересующимся — добро пожаловать под кат!

+60

olegnazarov 30 сен 2025 в 11:17

DevSecOps за 20 миллионов? Я сделал свой сканер и выложил бесплатно

3 мин

24K

Программирование * DevOps * Python * Информационная безопасность *

Я раньше работал обычным безопасником. Кто-то называет таких «ИБшниками», кто-то — «параноиками», кто-то — «тем самым занудой, который мешает жить».
Каждый день у меня был один и тот же диалог:

• Тимлид: «У нас релиз в пятницу, отстань со своим сканированием».
• Менеджер: «В бюджете только Jira и пицца, какие ещё 15 миллионов за софт?»
• Разработчик: «Код сгенерил AI, билд прошёл, значит, всё норм».

+58

maksimov_m 28 сен 2025 в 15:31

Что такое AI-агент и из каких основных частей он состоит

Средний

20 мин

34K

Искусственный интеллектPython * Natural Language Processing *

FAQ

В этой статье будет приведено описание AI-агента. Подробно рассмотрим основные его компоненты, а также реализуем их на языке Python.

🔥 Начинаем 🔥

+11

Antra 28 сен 2025 в 15:03

Как гонять Claude Code (и не только) с качественными моделями задешево?

Простой

4 мин

52K

Искусственный интеллектPython * TypeScript *

Туториал

Вижу много высказываний на тему, что Claude Code хорош, но очень дорог. И это правда. С платой за API деньги улетают с пугающей скоростью. А с подпиской быстро упираешься в ограничения. При этом есть модели вполне сравнимого качества, но в разы (если не на порядок) дешевле.

Как подключить?

+14

illian 28 сен 2025 в 13:43

Как я разрабатывал приложение llm-translate для перевода с помощью нейросетей

Средний

14 мин

19K

DIY или Сделай самPython * Искусственный интеллектМашинное обучение *

Кейс

Небольшой рассказ о том, как я начал делать инструмент для локального перевода текстов и файлов, с чего началось, и куда пришло.

Тема использования нейросетей в разных областях (в том числе и для перевода) часто обсуждалась на хабре - и я тоже решил поделиться своим велосипедом. В данный момент уже есть базовый функционал и некоторые планы на его расширение.

Код открыт, ссылка на репозиторий будет, ссылки на телеграм-канал не будет. В качестве компенсации за отсутствие ссылки на телеграм будут результаты небольшого исследования, какая LLM модель подходит лучше всего для перевода художественного текста с английского на русский - с замерами времени, качества переводов, а также с текстами полученных переводов.

Изображение на обложке - веб-интерфейс страницы перевода в созданном приложении.

+11

TrexSelectel 28 сен 2025 в 08:00

Топ языков программирования в 2025 году: рейтинг IEEE и влияние на него языковых моделей

4 мин

63K

Блог компании SelectelИскусственный интеллектПрограммирование * JavaScript * Python *

Привет, Хабр! IEEE Spectrum опубликовал ежегодный рейтинг языков программирования за 2025 год. Там много всего интересного, на что стоит обратить внимание. Давайте разберемся, как формируется этот список, какие языки пока что удерживают лидерство, кто теряет позиции и почему, а также как ИИ все (ну или почти все) меняет. Поехали!

+42

zzzzzzerg 27 сен 2025 в 16:20

CPython — Сборка мусора изнутри, ч.2

Сложный

16 мин

16K

Python * C * Программирование *

В прошлой части этого цикла статей мы рассмотрели, как происходит регистрация объектов в сборщике мусора, когда происходит планирование и вызов сборки мусора. В этой части разберем как запускается сборка мусора, подробно рассмотрим сборку для молодого поколения, затронем механизм подсчета ссылок и какие эффекты могут возникнуть при его работе.

Итак, продолжим.

+24

yakvenalex 27 сен 2025 в 07:25

Создание умных AI-агентов: полный курс по LangGraph от А до Я. Часть 3. Даём ИИ руки: работа с инструментами и MCP

36 мин

35K

Блог компании AmveraPython * Программирование * Искусственный интеллектNatural Language Processing *

Туториал

В третьей части курса по созданию ИИ‑агентов совершаем революционный скачок: превращаем умных болтунов в настоящих цифровых исполнителей с «руками».

Учим агентов самостоятельно работать с файлами, базами данных, API и внешними системами. Больше никаких просьб «пришлите мне файл» — агенты сами найдут данные, проанализируют их и создадут отчёт.

Осваиваем три мощных паттерна: ручные графы с инструментами для максимального контроля, ReAct‑агентов для простоты использования и мультиагентные системы, где каждый агент — эксперт в своей области.

От простых файловых операций до комплексных систем с оркестратором, которые автоматически исследуют темы в интернете, структурируют данные и создают профессиональные отчёты.

Плюс разбираем Model Context Protocol (MCP) — универсальный стандарт для подключения любых инструментов.

+10

Cheater121 24 сен 2025 в 08:28

RBACX — универсальный RBAC/ABAC-движок авторизации для Python

Средний

9 мин

7.1K

Python * Веб-разработка * Информационная безопасность * Open source *

Из песочницы

RBACX — авторизация без боли в Python-проектах

Когда доступ «размазан» по вьюхам и миддлварам, ревью и тесты превращаются в квест - появляется мотивация все это унифицировать. Я написал RBACX — лёгкий движок, где правила описываются декларативно (JSON/YAML), а проверка прав — это один понятный вызов. В статье показываю, как собрать из него аккуратный PDP для микросервисов и монолитов.

Я последние два года пишу бэкенд в стартапе MindUp — это мой первый пост на Хабре, и первая библиотека. Буду рад вопросам и критике. Если тема авторизации болит так же, как у меня, загляните!

+10

1 2 ...

17 18

20 21 ...

250 251