Articles / Bookmarks / Profile of zartdinov / Habr

User

ProfileArticlesPostsNewsComments419

Runoi Oct 24 at 21:15

Собираем ANPR-систему на Python: от YOLOv8 и кастомного OCR до INT8-квантизации

13 min

5.7K

Привет, Хабр!

Распознавание автомобильных номеров (ANPR) — задача не новая. Существует множество коммерческих решений и open-source библиотек. Но что, если стандартные инструменты не не подходят? А что, если нам нужна система, которая будет молниеносно работать на обычном CPU, без дорогих видеокарт?

Недавно я столкнулся именно с такой задачей. Вместо того чтобы просто "склеить" готовые решения, я решил пройти весь путь ML-инженера от начала до конца: от анализа данных до обучения кастомных SOTA-моделей и их финальной оптимизации. В этой статье я поделюсь всем процессом, кодом, результатами и проблемами, с которыми пришлось столкнуться.

Читать далее

+27

mikhailshpakov Oct 22 at 09:05

Зачем я решил научить Statuser следить за DNS — и что из этого вышло

Easy

4 min

2.2K

Timeweb Cloud corporate blogCloud services * Start-up developmentIT Infrastructure * Website development *

Case

Мы привыкли считать, что если сервер доступен и SSL в порядке — значит, всё под контролем. Но иногда сбой происходит раньше, ещё до того, как запрос дошёл до сервера.

Меня зовут Михаил Шпаков, я создаю и развиваю сервис мониторинга Statuser.

Недавно я общался с руководителем IT-отдела одной компании, которая использует Statuser для мониторинга своих сервисов. Он поделился интересным кейсом: несколько часов подряд у них перестала отправляться почта с корпоративного домена. Сайт работал, сервер был доступен, SSL-сертификат в порядке — всё зелёное, а письма не уходят. Проблема выглядела случайной: часть писем доставлялась, часть возвращалась с ошибкой, а из-за этого срывались заказы и возникали прямые убытки.

Когда их команда начала разбираться, выяснилось, что недавно один из сотрудников сменил почтового провайдера и добавил новые MX-записи в DNS, но старые при этом не удалил. В результате часть писем уходила на старый сервер, который уже не принимал почту, а часть — на новый. Снаружи всё выглядело исправно, но на деле домен был «раздвоен» между двумя почтовыми системами.

После этого разговора я понял, что в Statuser не хватает отдельного типа мониторинга — контроля DNS-записей. HTTP, SSL и Ping могут быть зелёными, но если в DNS остались старые MX, сервис уже фактически неисправен.

Так в Statuser появился новый тип мониторинга — проверки DNS, который помогает замечать изменения, подмены и ошибки в зонах ещё до того, как они превращаются в простои и убытки.

Читать далее

+26

inetstar Oct 21 at 14:30

Выжимаем из Go скорость до последних наносекунд

Medium

12 min

17K

RUVDS.com corporate blogGo * High performance * Programming * Debugging *

Tutorial

Будем оптимизировать программы на Go. Выжимать последние наносекунды, чтобы код приближался по скорости к Си или ассемблерному. Цель - скорость, чтобы процессор был загружен на 100% при высокопроизводительные вычислениях.

Читать далее

+84

slivka_83 Oct 18 at 16:41

Разработка MCP-сервера на примере CRUD операций

10 min

7K

Machine learning * Natural Language Processing * Artificial IntelligenceData Mining * Python *

Tutorial

Model Context Protocol (MCP) — это единый стандарт разработки API для сервисов, с которыми могут взаимодействовать LLM.

В этой статье на простом примере разберем, как создать свой MCP-сервер и как использовать его в связке с LLM.

Мои курсы: Разработка LLM с нуля | Алгоритмы Машинного обучения с нуля

Читать далее

+20

phillennium Sep 29 2023 at 11:00

Кто-нибудь, остановите feature creep

6 min

7.5K

JUG Ru Group corporate blogProduct Management * Usability * Interfaces *

На днях Apple выпустила очередную версию macOS. Но когда на презентации этой версии холёные топ-менеджеры наперебой говорили «amazing», я смотрел на анонсированные фичи и вместо «amazing» ощущал «ну блин, зачем». В macOS позволили добавлять виджеты прямо на рабочий стол, и из-за подобных вещей ощущаю, что компания постепенно захламляет свой продукт и предаёт свою собственную идеологию минимализма.

Новые фичи могут делать продукт не только лучше, но и хуже. Кто постарше — помните, как приложение NERO Burning ROM превратилось в монстра с тысячей щупалец? Ты хочешь просто записать CD-R, а ощущаешь, словно безумный комбайн поглощает всю твою жизнь. Или вот функции редактирования видео в Photoshop — это правда нужно? Может, Photoshop и без них достаточно сложная штука, а видео лучше оставить другим приложениям? А сториз в Телеграме точно делают всем только лучше, или кому-то они замусорят инструмент рабочей коммуникации? Почему мы не умеем вовремя останавливаться?

И в случае с macOS мне особенно обидно. Ведь Apple — это компания с подходом «мы не предустанавливаем на ноутбуки стороннюю дребедень за копеечку, как делают другие». С подходом «мы не обклеиваем ноутбуки рекламными наклеечками вроде Intel Inside». С подходом «ничего лишнего». А теперь она сама превращает собственную ОС в пёстрое лоскутное одеяло (не только виджетами).

Что происходит, кто виноват и что делать? Я далеко не первый, кто об этом говорит, так что вряд ли скажу что-то принципиально новое. Но думаю, чтобы такого было поменьше, эту тему нужно поднимать регулярно, напоминая о ней.

Читать далее

+33

beeline_cloud Oct 18 at 16:54

С толикой «крипоты» — откуда пришло понятие feature creep и как «ползучее расширение функциональности» вредит проектам

7 min

2.2K

Beeline Cloud corporate blogDesignUsability * Product Management * Project management *

Мы в Beeline Cloud недавно писали о ретрософте, который живет и поддерживается вот уже не первое десятилетие. Сила этих программ кроется в отказе от лишнего.

Во многом они выжили благодаря своей простоте: сохранили ядро, ключевую функциональность и лояльных пользователей. Поговорим о тех, кто все же не смог устоять. Разберем на примерах, как неконтролируемый feature creep превращает продукты в монструозных «франкенштейнов», от которых бегут пользователи.

Читать далее

+8

zuriad Oct 17 at 09:52

CLIP + LLM в проде: мультимодальный «Поиск по фото» для маркетплейса

Medium

9 min

3.5K

Wildberries & Russ corporate blogMachine learning *

Review

Привет! Меня зовут Никита Романов, и я техлид продуктов «Поиск по фото» и «Похожие по фото» в Wildberries. За спиной — более шести лет опыта в сфере компьютерного зрения (CV).

В этой статье мы обсудим онлайн сервис «Поиск по фото». А точнее, его архитектуру и основные компоненты — Image Retrieval, подбор текстовых тегов и уточнение текстом. Также обязательно поговорим о векторном индексе Qdrant, т.к. метрики и эксперименты мы тестируем в нём. Расскажем про результаты A/B-тестов и что уже в проде.

Читать далее

+15

PavelWeb3 Oct 12 at 20:02

NFT 2.0 TON

Easy

3 min

3.3K

CryptocurrenciesDecentralized networks *

FAQ

Что именно обновилось?

Чтобы ответить на этот вопрос нужно разобраться как вообще устроена технология NFT в TON.

Есть контракт TPEP 62 который является технической базой для всех NFT в блокчейне TON, там хранится например: принадлежность к коллекции, адреса контрактов и другая информация. Для него есть “дополнение” TEP 66 который показывает кому и сколько нужно выплачивать роялти с перепродажи NFT и как расчитывать это роялти. И 62 и 66 это ончейн информация, то есть находится в блокчейне.

Но сам файл NFT хранится уже не в блокчейне, это слишком дорого, а на сервере, также как и атрибуты NFT (в случае подарков это фон, модель и узор). Чтобы кошелек мог показать всю информацию о NFT, он через ссылку которая есть в блокчейне и прикреплена к каждому NFT, достает всю информацию с сервера.

Читать далее

0

Stanner Nov 25 2023 at 20:35

Установка и настройка Hysteria

Easy

10 min

44K

Configuring Linux * Information Security * System administration * Network technologies *

Tutorial

В этом году я, как и многие посетители Хабра, с огромным интересом читал статьи уважаемого MiraclePtr, учился применять озвученные им идеи и рекомендации, на практике знакомясь с протоколами, клиентами и графическими панелями. Для многих протоколов существуют подробные инструкции по установке и настройке, доступные самым неискушенным пользователям, начинающим знакомиться с миром Linux.

Дошли у меня руки и до вкратце описанного в статье «Современные технологии обхода блокировок: V2Ray, XRay, XTLS, Hysteria, Cloak и все-все-все» протокола Hysteria, который уже добрался до второй версии. И для него я не нашёл цельной русскоязычной инструкции, что вызвало желание собрать воедино информацию, когда я разобрался с основными вопросами установки, настройки сервера и клиентов для использования этого протокола в деле обхода блокировок.

Читать далее

+19

MidavNibush Oct 8 at 08:14

Chonkie: революция в RAG-чанкинге — скорость, лёгкость, удобство

Easy

11 min

14K

Raft corporate blogPython * Artificial IntelligenceProgramming *

Review

В эпоху, когда большие языковые модели (LLM) становятся всё более мощными и применяются во многих задачах, одна из ключевых проблем остаётся прежней — как эффективно снабжать их релевантным контекстом. Одним из популярных решений является подход RAG, где качество итогового ответа зависит от целого ряда факторов, одним из которых является качественное чанкирование исходных текстов. Сегодня мы рассмотрим одно из новых и интересных решений.

Всем привет! Меня зовут Вадим, я Data Scientist в компании Raft. В этой статье я расскажу о Chonkie — библиотеке для простого и быстрого чанкирования документов, а также на практике применю её и сравню с другими популярными решениями: LangChain и LlamaIndex.

Читать далее

+44

its_capitan Sep 30 at 08:57

$220К в месяц на индексации сайтов для Google

Easy

6 min

27K

Website development * Web services monetization * Start-up developmentProduct Management * Business Models *

Case

Разбираю, как программист создал простой сервис для рендеринга JavaScript в HTML. Продвинул его бесплатным способом. И вывел на доход $220К в месяц.

Читать далее

+53

artyrjin Sep 29 at 05:19

Альтернативная нотация описания архитектуры ИТ систем

Medium

4 min

4.9K

System Analysis and Design * Technical Writing * Project management * Development Management *

Альтернативная нотация описания функциональной архитектуры и архитектуры интеграций для решения задач ИТ-развития в рамках проектных задач, продуктового развития и инициатив бизнеса для командной работы в едином информационном поле бизнес и системных аналитиков, архитекторов, разработчиков, тестировщиков и специалистов поддержки.

Читать далее

+5

avovana7 Sep 27 at 07:23

Redis работает быстро — я буду кэшировать данные в Postgres

5 min

15K

Microservices * NoSQL * Distributed systems * System Analysis and Design *

Review

Translation

В интернете есть книги и множество статей, таких как эта, в которых авторы приводят аргументы в пользу использования Postgres для всего. Я решил рассмотреть один из вариантов использования — применение Postgres вместо Redis для кэширования. Я довольно часто работаю с API, поэтому я создал очень простой HTTP-сервер, который отвечает данными из этого кэша. Я начал с Redis, так как часто сталкиваюсь с этим на работе, а затем переключился на Postgres с использованием нежурналируемых таблиц и посмотрел, есть ли разница.

Читать далее

+13

master_program Sep 22 at 14:47

Революция в генерации изображений открывает новые подходы к созданию реалистичных картинок с помощью нейронных сетей

Medium

3 min

7.3K

Popular scienceMathematics * Artificial IntelligenceMachine learning * Image processing *

Команда российских ученых, работающих в МФТИ, Иннополисе и Сколково, совершила научный прорыв в области генеративного моделирования — создании новых изображений, похожих на настоящие фотографии или рисунки. Они разработали новый метод, который значительно ускоряет и упрощает процесс генерации в теории и на практике. Их результаты опубликованы в материалах конференции NeurIPS 2024.

В ранних моделях, основанных на сопоставлении потоков, «река» часто имела извилистые русла, а «путешествие» частиц было долгим и сложным. Это приводило к замедлению процесса генерации новых данных. Поэтому ученые искали способы сделать траектории потока максимально прямыми.

Существующие подходы к выпрямлению траекторий имели свои недостатки. Некоторые методы были итеративными, то есть многократно повторяли процесс улучшения «прямоты», накапливая при этом ошибки. Другие методы основывались на упрощенных приближениях, которые не гарантировали нужного результата.

Новый метод оптимального сопоставления потоков, представленный на конференции NeurIPS 2024, решает эти проблемы.

Читать далее

-1

black_cat Sep 18 at 07:25

Использование файберов в PHP: разбор от команды СберЗдоровье

Medium

12 min

8K

СберЗдоровье corporate blog

Review

PHP и асинхронность. Такая комбинация долгие годы казалась невозможной, ведь PHP прочно ассоциировался с блокирующим подходом и синхронным выполнением скриптов «от запроса до ответа». С выходом PHP 8.1 ситуация несколько изменилась — появилась возможность реализовать асинхронность в PHP на основе файберов. Но есть нюанс — вопрос о том, действительно ли PHP с приходом файберов стал асинхронным, по-прежнему для многих остается открытым.

Меня зовут Михаил Сазонов. Я работаю в команде «Регистратура» в MedTech-компании №1 в России – в СберЗдоровье. В этой статье я разберу, наступило уже будущее или нет: стал ли PHP действительно асинхронным с приходом файберов или это миф.

Читать далее

+26

dronbonpon Sep 9 at 07:00

Как мы ищем рестораны на карте: геоиндекс в Яндекс Еде

10 min

5K

Яндекс corporate blogSystem Analysis and Design * Geoinformation services * Algorithms * Search engine optimization *

Любому пользователю сервиса доставки еды важно быстро получать актуальную информацию о доступных ресторанах и стоимости доставки. От нас же простая задача определить, из каких ресторанов возможно оформить заказ для пользователя с учётом сложных и постоянно изменяющихся зон доставки, требует не только высокой скорости обработки запроса, но и оперативного обновления данных, а также экономии вычислительных ресурсов.

Привет! Меня зовут Серёжа Синягин, я старший разработчик в Яндекс Еде и пишу на C++. В этой статье расскажу о задаче, с которой столкнулся в работе: как мы определяем, какие рестораны доступны пользователю для заказа. По пути заглянем во внутреннюю кухню, обсудим библиотеку H3 от Uber и разберём, как устроены R‑деревья и как мы используем их у себя.

Читать далее

+25

vbystricky Sep 18 at 07:01

Как дорожные знаки попадают на карты Яндекса: применяем ML в картографии

11 min

28K

Яндекс corporate blogArtificial IntelligenceMachine learning * Geoinformation services * Algorithms *

Важное свойство любых карт — их актуальность. Чтобы Яндекс Карты максимально точно отражали дорожную обстановку, мы постоянно мониторим изменения в реальном мире. Один из факторов, который необходимо отслеживать, — это установка или демонтаж знаков дорожного движения.

Меня зовут Владимир Быстрицкий, я руковожу группой AI-картографирования. В этой статье расскажу о процессе детектирования дорожных знаков в картопроизводстве Яндекса: с чего всё началось, как развивалось, какие технологии использовались. Ну и попробую ответить на самый, на мой взгляд, главный вопрос в любой ML-задаче: как собрать датасет и не разориться?

Читать далее

+56

dercar Sep 14 at 16:49

Циан и Озон

Easy

7 min

15K

PeripheryDesignStart-up developmentBranding

Opinion

Дурацкий цвет, который выставлял в дурном цвете компанию, основная миссия которой заключается как раз в том, чтобы качественно воспроизводить цвет.

Читать далее

+80

butivskiydm Sep 6 at 15:27

Одна из причин «толстения» — продукты содержат больше калорий, чем написано

Easy

4 min

6.1K

Popular scienceHealth

Opinion

Когда всё подсчитано точно, а вес растёт или упорно стоит, даже при явном минусе скажем 700 килокалорий в сутки — помойте посуду... Есть такое правило в физике и химии — если эксперимент не идёт как надо, а все приборы‑пробирки настроены как надо — проверяйте контакты и мойте посуду.

Производители могут и порой нагло всем врут. Врут про содержание витаминов и особенно белка — это дорогие компоненты. Пихают лишний жир и углеводы — это дешёвые компоненты, Скажем пихнут лишнего пальмового масла и сахара вместо сухого концентрата яичного белка.

Набрёл на человека, он носит в лабораторию на анализ разные продукты. Недавно стаскал туда вкусности из вкусвилла — там в итоге везде всё хорошо с белком — его сколько, сколько указано на упаковке и везде — больше чем надо жира и углеводов. Вот те бабушка и приехали. Ответ на вопрос — я считаю всё до грамма и не худею — ты считаешь не по честной этикетке. Такое тоже увы реальность. Не все концентраты белков, протеиновые батончики и котлеты одинаково честно описаны производителями.

Читать далее

+33

SimpleOne_it Aug 29 at 12:29

Проектный VS продуктовый подход: почему 85% функций вашего продукта — мусор, и что с этим делать

8 min

4K

SimpleOne corporate blogDevelopment Management * Product Management * Project management *

Opinion

Привет! Меня зовут Артем Герасимов, я владелец продукта SimpleOne SDLC. В статье расскажу о проблеме, с которой сталкивается большинство ИТ-компаний: они тратят миллионы на разработку функций, которыми никто не пользуется.

Читать статью

+10

2

3 4 ...