All streams
Search
Write a publication
Pull to refresh
3
14
Алексей @alexsphera

User

Send message

Как мы научили нейросеть читать технические схемы и сразу считать их стоимость

Reading time5 min
Views6K

Когда думаешь о «цифровой трансформации» в промышленности, в голове обычно всплывают роботы, датчики, большие экраны и дроны, которые сами разносят детали по цеху. В реальности всё часто упирается в куда более прозаичные вещи.

Например — технические схемы. Представьте: целые шкафы с папками, где вперемешку свежие CAD-чертежи и сканы пожелтевших листов А3 с подписями от руки: «Смотри сюда», «замени резистор». Чтобы собрать спецификацию и посчитать стоимость, инженеру приходилось садиться с карандашом и Excel — и часами переписывать резисторы, транзисторы, конденсаторы, их номиналы и количество. Ошибся в одной букве или не заметил мелкий элемент — и вся цепочка снабжения поехала.

В какой-то момент мы, как разработчики, задали себе вопрос: «А почему в 2025 году до сих пор человек должен глазами считать резисторы на сканах, если есть компьютерное зрение и OCR?» Так и стартовал проект: сделать систему, которая за полминуты превратит «кривой скан схемы из прошлого века» в таблицу компонентов с готовой сметой.

Читать далее

Не дай Lottie уронить продакшен: зачем валидировать анимации

Reading time7 min
Views825

Кейс из жизни: мини-приложения, анимированные обложки, внешние команды — и одна на вид «валидная» анимация, которая кладет все приложение. Рассказываем, как мы научились воспринимать Lottie-файлы не как медиа, а как исполняемый код — и почему это улучшило стабильность всей системы.

Читать далее

Ошибки, которые не попадают в отчеты: как бизнес снижает риски через системную проверку знаний

Reading time3 min
Views1.3K

Есть темы, которые не попадают в отчеты. Например: почему сотрудник повредил дорогое оборудование, или почему склад простаивал два дня после смены логистики. Ответ чаще всего один — недостаток знаний. Он выражается в неочевидных мелочах: кто‑то не прошел инструктаж, кто‑то забыл порядок действий, кто‑то не понял обновленный регламент. Но в результате мы получаем производственные ошибки, травмы, штрафы и срывы сроков.

В таких отраслях, как логистика, транспорт, строительство, ритейл и промышленность, последствия бывают критичными. По оценкам Deloitte и McKinsey, до 20% операционной прибыли уходит на устранение ошибок персонала. А если смотреть на российские реалии — это более 500 млрд рублей в год потерь, связанных исключительно с «человеческим фактором».

Читать далее

Как мы построили embedding-модель уха на Vision Transformers: от идеи до 88% точности

Reading time4 min
Views1.2K

Пока весь мир гонится за распознаванием лиц и отпечатков пальцев, мы в решили взглянуть на человека чуть сбоку — буквально. 

Пришел клиент, принес проект. Система поиска родственных связей по фото. Все работает, все ищется, но хочется, чтобы было еще точнее, еще глубже. «А что если сравнивать… уши», — подумали мы. 

Почему уши? Потому что они, как и лица, обладают уникальной формой, но в отличие от лица — не меняются с возрастом, не маскируются бородой и не хмурятся на паспортном контроле.

Идеальный кандидат для дополнительного биометрического сигнала. Но не все так просто.

Нам предстоял полный цикл разработки модуля распознавания и сравнения ушей:

Читать далее

Когда не хватает смысла, а не кода: как UX-редактор и аналитик довели продукт до релиза

Reading time3 min
Views514

Когда говорят про аутстаффинг, в большинстве случаев речь идет о разработке: фронтенд, бэкенд, DevOps, тестирование. Это то, что легко измерить в часах и тасках. Но в работе над цифровым продуктом бывают моменты, когда задача не в том, чтобы «написать код», а в том, чтобы разобраться, что именно нужно писать и зачем. И вот тогда на первый план выходят не программисты.

Читать далее

Один кадр против спуфинга: как мы определяем фейковые лица без видео и биометрии

Reading time4 min
Views1.7K

Иногда пользователи пытаются пройти биометрическую верификацию не совсем честно. Иногда — совсем нечестно. Кто-то показывает фото на экране другого телефона, кто-то — печатает лицо на бумаге и машет им в камеру. 

Всё это — спуфинг, и он давно вышел из лабораторий и научных статей в суровую продакшен-практику. А задача при этом, казалось бы, простая: по одному кадру понять, есть ли перед камерой живой человек. Ни видео, ни поведенческой биометрии, ни инфракрасных сенсоров. Просто JPEG. Просто ад.

Все о спуфинге и методах борьбы с ним знает наш разработчик Александр. Он работает над проектом антиспуфинг-системы, способной по изображению с фронталки отличать живого человека от картинки.

В этой статье мы расскажем, как он научил систему это делать. Без волшебства: только кастомный датасет, ансамбль CNN и несколько костылей — куда без них.

Читать далее

Как ИИ преобразовывает рынок труда: исчезающие профессии и работы будущего

Level of difficultyEasy
Reading time4 min
Views1.7K

Современные технологические революции, такие как искусственный интеллект (ИИ) и автоматизация, уже давно начали оказывать влияние на нашу рабочую рутину. Как IT-предприниматель, я активно внедряю ИИ в бизнес-процессы. Каждый год появляются новые инструменты, которые значительно оптимизируют работу, освобождая сотрудников от рутинных задач и позволяя им сосредоточиться на более важных и творческих проектах. Однако, несмотря на очевидные преимущества, эти изменения несут определенные риски: многие профессии, как физические, так и интеллектуальные, уже исчезают, а некоторые могут исчезнуть в ближайшие десятилетия.

Что происходит сейчас?

Так, развитие ИИ-инструментов уже привело к сокращению числа операторов колл-центров, кассиров, водителей и других специалистов – эти тенденции наблюдаются уже несколько лет. Однако сегодня под угрозой находятся даже профессии, связанные с более сложной интеллектуальной деятельностью. В их числе, например, бухгалтеры и налоговые консультанты: ИИ и автоматизация процессов учёта и налоговых расчётов значительно снижают спрос на таких специалистов. Программы вроде Xero, QuickBooks и Intuit TurboTax могут выполнять задачи, которые раньше требовали участия человека. Под угрозой также финансовые аналитики и трейдеры: алгоритмическая торговля и системы машинного обучения, такие как Aladdin от BlackRock и другие роботы для анализа рынков, значительно увеличили скорость и точность финансовых решений, уменьшая потребность в рутинной аналитической работе.

По данным McKinsey Global Institute, на 2024 год под угрозой находились рабочие места в таких областях, как транспорт, розничная торговля, логистика и административная работа. Например, автоматизированные системы доставки и складской робототехникой уже могут существенно уменьшить потребность в тысячах работников, занимающихся складской обработкой и перевозками. Исследования McKinsey показывают, что к 2030 году до 800 миллионов рабочих мест могут быть заменены автоматизацией и ИИ по всему миру. Это касается рутинных профессий, таких как кассиры, водители, операторы производственных линий.

Читать далее

Карьера в ИТ: выгорание, потолок и ожидания рынка

Reading time5 min
Views1.5K

Карьера в IT остается самым привлекательным направлением как для тех, кто только выбирает, где начать свое развитие, так и для тех, кто уже состоялся как специалист в другой сфере. Однако большое количество специалистов сегодня быстро достигает потолка в IT, вследствие чего выгорает и не понимает, что делать дальше. О том, как оставаться актуальным специалистом всегда, куда будет развиваться рынок и чего ждут сегодня от разработчиков поговорили с руководителем разработки Axenix, AP-3 Виталием Полещук. 

Где потолок развития в IT?

Для IT-специалистов момент, когда становится сложно понять, куда расти дальше, наступает довольно часто. Потолок развития ощущается, когда специалист перестает видеть четкую траекторию дальнейшего роста или не знает, какие именно навыки нужно развивать для перехода на следующий уровень.

Часто это связано с узкой специализацией, свойственной многим IT-направлениям. Например, разработчик, став экспертом в своей области, сталкивается с выбором: продолжать техническое развитие или переходить на управленческие роли. Но управленческая карьера пугает многих, поскольку она требует отхода от привычной зоны ответственности и освоения нового подхода к работе — через процессы, метрики, работу с командой.

На практике потолок чаще всего не внешний, а внутренний. Люди боятся брать на себя новые задачи, которые требуют навыков, выходящих за рамки их опыта. Это как шаг в неизвестность: никогда не знаешь, насколько успешно ты справишься, пока не попробуешь. Но именно это испытание позволяет по-настоящему расти. Важно помнить, что горизонт развития можно расширить, если начать видеть свою работу не только через призму технологий, но и в контексте продукта, пользователей и бизнеса.

Читать далее

Создание искусственного датасета для обучения модели с использованием Paddle OCR

Reading time4 min
Views1.8K

Привет, коллеги! Продолжаем тему разработки плагина для распознавания иврита с использованием Paddle OCR. В прошлый раз я забыла представиться, сделаю это в этом посте)
Меня зовут Алексей, я руковожу компанией, которая занимается разработкой с применением ИИ-технологий. Сам я  тоже погружен в разработку, но больше доверяю это своей команде – нам удалось собрать команду классных профи. Истории из нашей совместной работы я и планирую рассказывать в своем блоге.

Вернемся к теме статьи. Сегодня остановимся подробнее на создании искусственного датасета для обучения модели с использованием Paddle OCR. Этим занимался мой коллега Александр – экспертв компьютерном зрении.

Когда перед нами встала задача распознавания текста на иврите, стало ясно, что найти готовый датасет с нужными характеристиками практически невозможно. Это подтолкнуло нас к созданию собственного датасета, который оказался не только полезным, но и дал возможность потренироваться в генерации синтетических данных. В этом посте мы подробно расскажем, как именно подошли к этому процессу.

Читать далее

Создание плагина для распознавания текста на иврите: мой опыт и решения

Reading time3 min
Views1.9K

Всем привет! Хочу поделиться недавним проектом, в котором я разрабатывал плагин для распознавания текста на иврите. Задача была непростая, особенно учитывая, что клиент уже пытался использовать Tesseract OCR, но точность распознавания оставляла желать лучшего. В этой статье расскажу о том, с какими трудностями я столкнулся и как их преодолел.

Читать далее

Information

Rating
502-nd
Registered
Activity

Specialization

Fullstack Developer, ML Engineer
Senior