Статьи / Закладки / Профиль sswwssww / Хабр

Some Name @sswwssww^{read⁠-⁠only}

Middle Python Backend Developer

ПрофильКомментарии258Закладки925

Safreliy 28 мая в 09:27

На START, внимание, марш: как победить галлюцинации и научить LLM точным вычислениям

Простой

4 мин

1.9K

Блог компании Postgres ProfessionalИскусственный интеллектМашинное обучение*Python*

Обзор

START — опенсорсная LLM для точных вычислений и проверки кода. В START решены две главные проблемы большинства обычных моделей: галлюцинации и ошибки в многоэтапных расчетах. В статье разберемся, зачем и как именно эти проблемы решены.

+11

andrey7657956 26 мая в 11:18

Pytest-xdist: как распараллелить тесты без конфликтов в базе

Средний

15 мин

2.5K

Блог компании KTSPython*Тестирование IT-систем*Базы данных*PostgreSQL*

Туториал

Привет! Я Андрей Сташок, бэкенд-разработчик в KTS. В этой статье я расскажу о запуске параллельных тестов через pytest-xdist.

Почему это важно?

Объясню на нашем примере. При разработке продуктов мы постоянно выполняем юнит-тестирование. Раньше мы проверяли все последовательно, и с расширением тестовой базы время проведения испытаний заметно возрастало. Распараллеливание через pytest-xdist помогло нам сильно ускориться, и сегодня я хочу поделиться этим трюком с вами.

Я расскажу, как запускать параллельные тесты для реляционной БД PostgreSQL (с драйверами asyncpg и psycopg2) и key-value БД Redis. Для подключения к реляционной БД мы будем использовать SQLAlchemy, а для Redis — библиотеку redis. Кроме того, я рассмотрю, как автоматизировать выполнение миграций при каждом запуске тестов с использованием alembic.

+30

mr-pickles 26 мая в 08:25

Первый год free-threaded Python

Простой

6 мин

6.3K

Блог компании Wunder FundPython*Программирование*

Перевод

На прошлой неделе разработчики CPython выпустили CPython 3.14.0b1. А на этой неделе в Питтсбурге, штат Пенсильвания, начинается конференция PyCon 2025. Оба эти события знаменуют собой важную веху в делах, связанных с разработкой, выпуском и доведением до стабильного состояния релизов free-threaded Python (Python с поддержкой свободной многопоточности — с отключённым механизмом GIL).

Перед вами рассказ о первом годе развития этого проекта, и о той роли, которую мы, сотрудники Quansight, в нём сыграли. А именно, речь идёт о том, что мы обеспечили возможность экспериментального использования сборок Python с поддержкой свободной многопоточности. Применялись они в реальных продакшн-системах, поддерживая процессы, которые основаны на сложных наборах зависимостей.

+23

sound_right 27 мая в 06:33

Тестовые идентификаторы: как и где расставлять правильно

20 мин

5.9K

Тестирование IT-систем*Тестирование веб-сервисов*Python*JavaScript*TypeScript*

По фактам: почему CSS и XPath — путь в ад, а test-id — спасение. В статье — реальные советы, как договориться с командой, внедрить test-id и писать автотесты, которые не разваливаются каждую пятницу.

+23

PatientZero 22 мая в 10:01

Поднимайте If вверх, опускайте For вниз

Простой

3 мин

32K

Качество кода*Программирование*Алгоритмы*

Перевод

Эта статья — краткая заметка о двух связанных друг с другом эмпирических правилах.

Поднимайте If вверх

Если внутри функции есть условие if, то подумайте, нельзя ли его переместить в вызывающую сторону:

// ХОРОШО

fn frobnicate(walrus: Walrus) {

... }

// ПЛОХО

fn frobnicate(walrus: Option<Walrus>) {

let walrus = match walrus {

Some(it) => it,

None => return,

};

...

}

В подобных примерах часто существуют предварительные условия: функция может проверять предусловие внутри и «ничего не делать», если оно не выполняется, или же может передать задачу проверки предварительного условия вызывающей её стороне, а при помощи типов (или assert) принудительно удовлетворить этому условию. Подъём проверок вверх, особенно в случае предварительных условий, может иметь лавинообразный эффект и привести к уменьшению общего количества проверок. Именно поэтому и возникло это правило.

+55

valentina-p 20 мая в 07:37

Знакомьтесь, FRIDA. Открытая эмбеддинг-модель для русского языка

Средний

8 мин

12K

Блог компании SberDevicesИскусственный интеллектМашинное обучение*

В этой статье мы расскажем о нашей новой модели FRIDA, которая сейчас (20.05.2025) занимает первое место в русскоязычном бенчмарке MTEB (ссылка на таблицу лидеров).

Ранее мы уже рассказывали на Хабре о создании русскоязычных задач для MTEB. Напомним, что этот бенчмарк предназначен для оценки моделей, способных создавать эмбеддинги текста — векторные представления, применяемые в различных задачах NLP.

+55

ArtemKQA 17 мая в 10:16

Как я научился анализировать собственные собесы с помощью Whisper (и почему это нужно каждому айтишнику и не только)

Простой

3 мин

17K

Искусственный интеллектКарьера в IT-индустрииPython*ИнтервьюOpen source*

Из песочницы

Сезон Open source

Собеседования - всегда стресс. Я замечал, что после каждого интервью трудно вспомнить детали: какие вопросы задавали, как именно я отвечал, где были ошибки или неточности. А переслушивать запись, которая может длиться от часа и выше это долго и неэффективно.

Задумался: а что если использовать что-то, что автоматически превратит аудиозапись интервью в текст? Так я открыл для себя Whisper от OpenAI. Под катом подробности о его применении.

+21

Bright_Translate 18 мая в 09:01

Издержки микросервисов, которые ваш стартап может не потянуть

Средний

15 мин

13K

Блог компании RUVDS.comМикросервисы*Развитие стартапаУправление продуктом*Управление разработкой*

Мнение

Перевод

Выживание стартапа зависит от того, насколько быстро вы сможете вносить доработки, поставлять новые функции и обеспечивать ценность для конечных потребителей. И во всём этом важную роль играет выбранная вами базовая архитектура. Кроме того, оперативность команды напрямую зависит от технологического стека и используемого языка программирования. Неудачная архитектура, особенно на базе незрелых микросервисов, может сильно подорвать продуктивность и привести к срыву планов по выпуску продукта.

Читать дальше →

+65

VRV 16 мая в 14:31

Личный VPN сервер: настрой VLESS за два клика — autoXRAY

Простой

3 мин

31K

Серверное администрирование*Серверная оптимизация*Информационная безопасность*Системное администрирование*DIY или Сделай сам

Кейс

Сейчас в сети много инструкций по установке GUI-панелей, таких как Marzban, 3x-ui или новая RemnaWave. Однако, все они избыточны для домашнего использования, так как предназначены для крупных проектов и отличаются высокой сложностью настройки.

Мануал, который необходимо пройти до получения первого рабочего конфига, занимает более 10 страниц. Кроме того, подходящий конфиг для Xray нужно ещё поискать и правильно настроить — с этим отлично справляется Bash-скрипт autoXRAY.

Без GUI и базы данных Xray потребляет меньше ресурсов сервера и отлично подходит для запуска на слабых VPS-конфигурациях!

При каждом запуске autoXRAY генерирует новые UUID, ключи и пароли для защиты пользователей, а также выбирает случайные SNI из списка для маскировки.

+14

Aleron75 13 мая в 01:24

Model Context Protocol (MCP): как подружить нейросети со всеми API за пару кликов

Простой

9 мин

12K

Блог компании Data Feeling SchoolМашинное обучение*Natural Language Processing*

Обзор

Казалось бы, совсем недавно мир только начал знакомиться с тем, что такое большие языковые модели (LLM). Вскоре после этого появились их многочисленные вариации — на любой вкус и цвет, от узкоспециализированных до универсальных моделей. Затем началась волна интеграций: LLM начали встраивать в различные сервисы, приложения и API, упрощая и автоматизируя рутинные процессы.

Следующим стало появление LLM-агентов — интеллектуальных систем, способных самостоятельно принимать решения и выполнять сложные задачи, взаимодействуя с внешними сервисами. Вместе с ростом их популярности возникла новая проблема — отсутствие единого стандарта взаимодействия между агентами и их окружением.

И вот, компания Anthropic представила решение этой задачи — новый протокол Model Context Protocol (MCP), который стандартизирует взаимодействие агентов с различными сервисами и между собой.

Давайте разберёмся, что такое MCP, и с чем его едят!

+14

natalia_varenik 14 мая в 13:16

Как декомпозиция повышает точность распознавания текста: опыт с фотографиями СТС

Средний

9 мин

14K

Блог компании AvitoTechData Engineering*Искусственный интеллектМашинное обучение*

Туториал

Привет! Меня зовут Наталия Вареник, я DS-инженер в Авито, занимаюсь моделями распознавания изображений. Расскажу про один из наших проектов — пайплайн для распознавания номеров с фотографии свидетельства транспортного средства (СТС). В статье описала особенности задачи и рассказала, как мы решали её с помощью декомпозиции.

Материал будет полезен начинающим и мидл-DS-инженерам, которые хотят узнать больше про декомпозицию задачи на этапах разметки и построения моделей.

А еще материал стоит прочитать тем, кто работает с доменами, где нужно иметь дело с задачами распознавания информации с документов — наш подход прекрасно переносится на другие категории. В целом рекомендую статью всем, кто интересуется компьютерным зрением и его применимостью в разных сферах.

+33

avovana7 14 мая в 10:15

System Design — ТОП 5 ошибок новичка на интервью

Простой

9 мин

15K

Микросервисы*Распределённые системы*Анализ и проектирование систем*Интервью

Туториал

Почему так сложно пройти первые System Design Интервью? Какие есть подводные камни? Оказывается, что не все понимают базовый алгоритм прохождения, а также нюансы движения по основным этапам.

Меня зовут Владимир и я senior backend в геораспределенной HighLoad системе. Которая выдерживает пиковые нагрузки в млн RPS. Моя страсть System Design. Я успешно прохожу интервью в BigTech компании, а также готовлю учеников. Выделил ТОП-5 ошибок у новичков и готов поделиться их разбором. Подробности под катом.

Узнать ошибки

+19

olegchir 14 мая в 13:53

INTELLECT-2: Первая большая (32B) параметрическая модель с распределенным обучением

Простой

5 мин

3.7K

Блог компании AnarchicМашинное обучение*Искусственный интеллектПрограммирование*Децентрализованные сети*

Обзор

Обычно нейросети нужно тренировать на мощном железе, сконцентрированном в одном датацентре. Результат такой тренировки попадает в руки той бигтех-корпорации, которой по карману иметь свои датацентры и самостоятельно тренировать модели за бешеные миллионы баксов. Есть ли другой путь?

Встречайте INTELLECT-2 — первую параметрическую модель размером 32B, обученную с помощью асинхронного обучения с подкреплением (RL) на динамическом, однородном рое вычислительных узлов. Доступ к узлам изолирован и не требует дополнительных привилегий — теоретически, это могут быть какие-то компьютеры волонтёров в интернете.

Инфра под это, мягко говоря, нестандартная. Разработчикам пришлось написать несколько компонентов с нуля, и вот что у них получилось...

И что получилось?

+16

yakvenalex 10 мая в 07:49

FastAPI + Keycloak: Простая и безопасная авторизация в веб-приложении на примере реального проекта

34 мин

14K

Блог компании AmveraПрограммирование*Python*Веб-разработка*Проектирование API*

Туториал

Keycloak - это мощная open-source платформа для аутентификации и авторизации, которую используют даже банки и крупные корпоративные клиенты для защиты своих приложений и данных.

В статье на реальном примере (FastAPI + Python) простым языком объясню, как Keycloak помогает упростить управление доступом и почему его принципы универсальны для любого бэкенда, независимо от выбранного языка программирования

+15

Myskat_90 12 мая в 08:35

Распределённый инференс и шардирование LLM. Часть 1: настройка GPU, проброс в Proxmox и настройка Kubernetes

Сложный

14 мин

Блог компании ФлантБлог компании Московский кредитный банкИскусственный интеллектKubernetes*DevOps*

Туториал

Когда модель DeepSeek R1 стала широко обсуждаться в сообществе, я заинтересовался, можно ли эффективно использовать её и другие крупные модели в домашних условиях, не прибегая к дорогостоящим облачным сервисам. Поскольку DevOps и инфраструктурой я увлекаюсь уже несколько лет, у меня постепенно сформировалась домашняя лаборатория, на которой я и решил проверить эту идею.

Эта статья в трёх частях — результат моего опыта в решении этой задачи. Внутри вас ждёт пошаговое руководство по реализации бюджетного распределённого инференса с использованием Ray Serve, vLLM, Kubernetes, Proxmox и других технологий. В первой части мы разберём настройку GPU и его проброс в Proxmox, развернём Kubernetes-кластер, установим GPU Operator и KubeRay Operator.

Поехали!

+58

itsm_lady 6 мая в 09:21

Для архитекторов и аналитиков: шаблон описания архитектуры приложения (34 страницы пользы)

Простой

3 мин

29K

Анализ и проектирование систем*Бизнес-модели*IT-стандарты*

Туториал

Архитектура программного обеспечения — основа, от которой зависят качество, производительность и масштабируемость систем. В статье шаблон от экспертов в области архитектуры программного обеспечения с типовыми описаниями и примерами архитектурных представлений. Шаблон доступен для скачивания.

+68

About_it 4 мая в 13:01

Чистый код — красивая архитектура. А работает ли это?

Простой

12 мин

19K

Блог компании RUVDS.comАлгоритмы*Анализ и проектирование систем*Программирование*Качество кода*

Обзор

Вы пишете код не для компилятора — он съест любую абракадабру, если синтаксис верен. Вы пишете для людей, для того парня из соседнего отдела, который будет разбирать ваш код через полгода. Для себя, когда забудете, о чём думали в момент написания. Для тимлида, у которого нет времени расшифровывать ваши «фичи», замаскированные под техдолг.

Грязный код — это про непонятные переменные, запутанные модули и решения «на скорую руку». Вас ждёт после такого потеря во времени и в лучшем случае косые взгляды коллег. К сожалению, непонятный код часто пишут не только из-за спешки, но и из-за неопытности и чрезмерного энтузиазма тех, кто хочет всё переделать.

Видели те горящие глаза джунов-зумеров при приеме на работу, думаю в них можно прочитать: «ваш код кривой, пустите меня в прод и сделаю все как надо..» и начинает строить собственные «идеальные» архитектуры.

Так что эстетика кода — это не пунктик перфекциониста, это прагматизм, и код нужно писать так, чтобы после него следующий разработчик ставил вам свечку в мыслях.

Давайте разберём, как превратить кошмар в конфетку — детали внутри.

Читать дальше →

+53

151

ivankov_timofei 2 мая в 13:06

Распределённые транзакции в микросервисах: от SAGA до Two‑Phase Commit

29 мин

13K

Распределённые системы*Микросервисы*Программирование*Проектирование и рефакторинг*Высоконагруженные системы*

Переход от монолита к микросервисной архитектуре приносит гибкость и масштабируемость, но и создает новые сложности. Одна из ключевых проблем –согласованность данных и транзакции. В монолите обычно можно обернуть несколько операций одной ACID-транзакцией: либо все операции выполняются успешно, либо при ошибке происходит полный откат. В мире микросервисов такой прямолинейный подход не работает. Каждый сервис автономен, у каждого своя база данных, и общаются они через сеть. Как результат, гарантировать атомарность и целостность процессов, охватывающих несколько сервисов, непросто. Возникает риск частичных обновлений: одна часть системы изменилась, а другая – нет, что приводит к неконсистентным (несогласованным) состояниям данных.

Чтобы решить эту проблему, разработаны специальные паттерны и протоколы управления распределёнными транзакциями. В этой статье детально рассмотрим ограничения классических ACID-транзакций в распределённой архитектуре, а также два подхода к распределённым транзакциям – сага (SAGA) и двухфазный коммит (2PC). Разберём мотивацию, принципы работы, преимущества и недостатки каждого, сравним их по критериям. Кроме того, обсудим альтернативные подходы, такие как TCC (Try-Confirm-Cancel), паттерн Outbox, а также кратко упомянем eventual consistency, транзакционные сообщения, инструменты вроде Atomikos и др. В завершение – практические рекомендации, как выбрать подходящий способ обеспечения согласованности в ваших микросервисах.

+37

DubnovyBlazen 2 мая в 14:00

OLMo: (Миниатюрная) Открытая Языковая Модель

Средний

7 мин

4.6K

Блог компании AnarchicМашинное обучение*Искусственный интеллектПрограммирование*

Туториал

OLMo — моделька от AI2, разработанная учёными для учёных. Если вы занимаетесь экспериментами над нейронками, это идеальный вариант: весь код и данные, необходимые для тренировки, открыто лежат на GitHub. Более того, выложены даже промежуточные чекпоинты, с очень высокой гранулярностью. Это отличает ее от якобы "открытых" нейронок, которые обычно приходят к тебе монолитным финальным бинарём.

Эта статья — короткий гайд, адаптированный с GitHub создателей нейросети и проверенный на практике.

Интересно. Читать далее

+22

kirillsulim 27 янв 2021 в 20:23

Строгая десериализация YAML в Python c библиотекой marshmallow

5 мин

7.7K

Python*

Туториал

Перевод

Исходная задача

Необходимо прочитать нетривиальный конфиг из .yaml файла.
Структура конфига описана с помощью дата-классов.
Необходимо, чтобы при десериализации были выполнены проверки типов, и, если данные невалидны, было брошено исключение.

То есть, проще говоря, нужна функция вида:

def strict_load_yaml(yaml: str, loaded_type: Type[Any]):
    """
    Here is some magic
    """
    pass

И эта функция будет использоваться следующим образом:

Читать дальше →

3 4 ...

41 42

На START, внимание, марш: как победить галлюцинации и научить LLM точным вычислениям

Pytest-xdist: как распараллелить тесты без конфликтов в базе

Первый год free-threaded Python

Тестовые идентификаторы: как и где расставлять правильно

Поднимайте If вверх, опускайте For вниз

Знакомьтесь, FRIDA. Открытая эмбеддинг-модель для русского языка

Как я научился анализировать собственные собесы с помощью Whisper (и почему это нужно каждому айтишнику и не только)

Издержки микросервисов, которые ваш стартап может не потянуть

Личный VPN сервер: настрой VLESS за два клика — autoXRAY

Model Context Protocol (MCP): как подружить нейросети со всеми API за пару кликов

Как декомпозиция повышает точность распознавания текста: опыт с фотографиями СТС

System Design — ТОП 5 ошибок новичка на интервью

INTELLECT-2: Первая большая (32B) параметрическая модель с распределенным обучением

FastAPI + Keycloak: Простая и безопасная авторизация в веб-приложении на примере реального проекта

Распределённый инференс и шардирование LLM. Часть 1: настройка GPU, проброс в Proxmox и настройка Kubernetes

Для архитекторов и аналитиков: шаблон описания архитектуры приложения (34 страницы пользы)

Чистый код — красивая архитектура. А работает ли это?

Распределённые транзакции в микросервисах: от SAGA до Two‑Phase Commit

OLMo: (Миниатюрная) Открытая Языковая Модель

Строгая десериализация YAML в Python c библиотекой marshmallow

Исходная задача

Информация

Специализация