NtechLab, Москва - Мировой лидер в разработке решений на основе ИИ. / Статьи / Хабр

Компания NtechLab временно не ведёт блог на Хабре

Статьи18Посты

HelloLena 17 фев в 10:40

Модели, гипотезы и планирование: хроники ML-инженера на крупнейшем хакатоне

Простой

7 мин

5.3K

Блог компании NtechLabМашинное обучение * Обработка изображений * Хакатоны

Обзор

В прошлом году наша команда неожиданно для себя стала призером на хакатоне «Лидеры Цифровой трансформации». В первой части статьи моя коллега рассказала о своих открытиях и эмоциях. В этой части мы расскажем технические детали решения задачи по распознаванию поврежденных и больных деревьев в городской среде.

Im_Katherine_Is 26 янв в 11:11

Данные, дедлайны и бессонные ночи: хроники junior дата-инженера на крупнейшем хакатоне 2025

Простой

6 мин

Блог компании NtechLabIT-компанииPython * Карьера в IT-индустрииХакатоны

Мнение

Всем привет!Меня зовут Екатерина — data engineer jr. Если вы начинающий специалист и думаете, что хакатоны — удел опытных сеньоров, эта история для вас. Год назад я не верила, что смогу подняться на сцену крупнейшего IT‑соревнования. Однако мой опыт на хакатоне «Лидеры цифровой трансформации — 2025» доказал, что победа на старте карьеры возможна.

«Лидеры цифровой трансформации»‑ это крупнейший международный онлайн‑хакатон мэра Москвы для IT‑специалистов. Проект фокусируется на реальных проблемах Москвы и бизнеса, предлагая участникам искать нестандартные решения для живых кейсов, а победители получают не только призовые деньги, но и преимущество при рассмотрении резюме для дальнейшего сотрудничества.

Здесь не будет мотивационной речи, только анализ того, как нашей команде удалось войти в топ-3. Разберемся как собрать команду из «я один», что делать, когда данные подводят, как перестроить свою роль на ходу и почему хакатон — лучший в мире лифт для джуна.

r_revel 21 авг 2025 в 10:59

Linux для начинающих: WSL — это читерство. Как Microsoft дал нам Linux без головной боли. Часть 2

Простой

8 мин

46K

Блог компании NtechLabWindows * Разработка мобильных приложений * Linux * Веб-разработка *

Туториал

WSL2 — удобный инструмент, но, как и любая технология, он не идеален. В этой статье я хочу рассказать о нескольких подводных камнях, с которыми столкнулся сам, и о том, как их можно обойти. Мы не только разберем решения распространенных проблем, но и раскроем потенциал WSL2: запустим Docker с GPU-ускорением для нейросетей и даже Android Studio. Забудьте о конфликтах сред и долгой настройке после переустановки системы — превратите WSL2 из источника проблем в мощный инструмент, который работает на вас

+13

r_revel 15 мая 2025 в 16:12

Linux для начинающих: WSL — это читерство. Как Microsoft дал нам Linux без головной боли

Простой

9 мин

152K

Блог компании NtechLabJavaScript * PHP * Laravel * Windows *

Туториал

В этой статье я хочу поделиться своим опытом настройки WSL для комфортной разработки, а также размышлениями о том, почему такой подход оказался для меня оптимальным. На это влияет несколько факторов.

Во-первых, иногда требуется специфический софт, который доступен только под Windows. Да, в других ОС могут быть аналоги, но зачастую они менее удобны или требуют дополнительной настройки.

Во-вторых, для разных проектов нужно разное окружение. WSL позволяет легко изолировать среды разработки, настраивая их под конкретные задачи или группы проектов. Это гораздо удобнее, чем держать несколько физических машин или постоянно переустанавливать систему.

Наконец, есть и субъективный фактор — привычка. Я с самого начала работал с Windows, и, несмотря на все преимущества Linux, полностью перестроить рабочий процесс оказалось сложно. WSL в этом плане — идеальный компромисс: Linux-окружение под рукой, но без необходимости отказываться от удобств Windows.

+28

219

vartemkin 5 фев 2025 в 09:42

Создаю онлайн-плеер с нейросетями и кошкодевочками

12 мин

11K

Блог компании NtechLabJavaScript * TypeScript * ЗвукМашинное обучение *

Эта статья о том, как череда не связанных между собой событий привела меня от разработки программы цветомузыки на Arduino к созданию функционального онлайн-плеера, который не только закрыл мои музыкальные потребности, но и заменил мне и моим друзьям ушедшие зарубежные стриминговые площадки.

Всем привет. Меня зовут Владислав. Я работаю в компании NTechLab фронтенд-разработчиком и уже более 10 лет пишу на JavaScript и TypeScript. В своей жизни я часто использую эти навыки для решения различных бытовых задач. Как и в этой истории, например.

Читать дальше →

+11

r_revel 22 янв 2025 в 08:33

Гибкость и контроль над данными: применение моков в разработке

Простой

11 мин

3.7K

Блог компании NtechLabJavaScript * TypeScript * Тестирование веб-сервисов *

Туториал

В современной разработке приложений важным аспектом является способность быстро и эффективно создавать прототипы и демонстрационные версии. В этом посте мы расскажем о нашем опыте использования моков (mocks) для эмуляции бэкенда на примере фронтенд-проекта. Мы поделимся ключевыми проблемами, с которыми столкнулись, и решениями, которые помогли нам ускорить разработку, улучшить стабильность и обеспечить гибкость в работе с данными. Вы узнаете, как мы использовали Mock Service Worker (MSW) и Vite-плагин для создания изолированного и удобного окружения, а также какие преимущества это принесло нашей команде.

NtechLab_Team 9 дек 2024 в 11:35

Поддерживаемые тесты в JMeter: tips and tricks

Средний

8 мин

2.7K

Блог компании NtechLabТестирование веб-сервисов * Тестирование IT-систем *

Туториал

Когда мы в NTechLab первый раз задумались о проведении нагрузочных тестов для наших продуктов, выбор инструмента для нас был очевиден: JMeter имел мощное комьюнити, обширный набор доступных плагинов и возможность написать свой при необходимости. Немаловажным фактором стало и то, что в интернете масса статьей о том, как начать работать с JMeter.

Однако, очень скоро мы столкнулись с ситуацией, когда количество кейсов нагрузочного тестирования разрослось, а написанные нами скрипты в JMeter стали напоминать нагромождение бессвязных элементов. С каждым релизом поддерживать тестовый набор таких скриптов становилось всё сложнее. Сюрпризом стало и то, что несмотря на большое количество статей посвященных старту работы с JMeter, статей которые бы рассказывали о том как грамотно развивать нагрузочные тесты в JMeter — не нашлось.

Мы в NTechLab проводим много нагрузочных тестов для своих продуктов и в этой статье расскажем какими трюками пользуемся, чтобы наши JMeter тесты всегда были легко поддерживаемыми и читаемыми, а регрессионное нагрузочное тестирование продуктов не становилось пыткой.

+14

n_glebko 13 ноя 2024 в 11:21

Инхаус-разметка с нуля. Реально ли это и насколько полезно?

Средний

12 мин

1.7K

Блог компании NtechLabBig Data *

Мнение

Разметка данных нужна для обучения нейронных сетей. К примеру, если мы учим сеть отличать живое лицо человека от фотографии или силиконовой маски для Face ID, то нам нужно разметить много-много фотографий человека, показать ИИ его маску и живое лицо. В этом посте расскажу, как мы это делаем в NtechLab и где берем людей для разметки большого объема данных. Также попытаюсь ответить на вопрос, стоит ли создавать собственные отделы по разметке данных внутри компании или можно ограничиться краудсорсингом или аутсорсингом, расскажу о некоторых рабочих кейсах. Приятного чтения!)

Что такое разметка данных?

Привет, Хабр! Меня зовут Надя Глебко. В NtechLab я проработала почти 4 года. Когда-то я пришла в компанию в качестве junior менеджера по разметке без особого опыта – но уже спустя полгода начала строить команду внутри компании. А уже через три года стала руководителем команды в составе 8 менеджеров и 3 валидаторов, а база наших инхаус-разметчиков составила около 100 человек. За это время был пройден невероятный путь роста и развития, проб и ошибок – и мне видится полезным поделиться этим опытом со всеми, кому интересна эта сфера. Но начнем с базы)

HelloLena 30 окт 2024 в 13:11

Text-to-speech. Анализ открытых решений синтеза речи

11 мин

34K

Блог компании NtechLabМашинное обучение *

Обзор

Всем привет! В этой статье будут рассмотрены открытые проекты по синтезу речи с поддержкой русского языка. Под словом «открытые» будем иметь в виду, что разработчики безвозмездно предоставляют в пользование результаты своих трудов (спасибо им за это большое). Также в обзоре вы найдете краткое описание решений с примерами генерации аудио по тексту и полезными ссылками для начального погружения в задачу text-to-speech. Приятного прочтения.

+17

olgatrofimova96 3 окт 2024 в 13:22

Ищем потерявшихся питомцев с помощью нейросетей

Простой

10 мин

5.5K

Блог компании NtechLabИскусственный интеллектМашинное обучение * Обработка изображений *

Кейс

Представьте себе, ваш питомец вдруг ~~сбежал~~ отправился в увлекательное путешествие по соседским дворам. Паника, нервы, поиски, бумажные объявления... И хорошо, если ваш пушистик чипирован, но ведь о таком заботятся не все. Можно пойти шерстить порталы с потеряшками, но где искать? Как они работают? Тот еще квест! Хотелось бы автоматизировать этот поиск и здесь как нельзя кстати подойдут нейросети. Мы обучили сеточки для детектирования и распознавания мордочек, которые могут стать основой для удобного сервиса поиска потерявшихся животных.

Мы запилили удобного демо-бота с этими сеточками, он называется FindPet. И теперь с удовольствием представляем его вам и рассказываем, как мы его создавали.

+14

Lenny_nn 15 дек 2021 в 08:03

Алгоритм распознавания лиц [Название_Компании] признан лучшим в мире

14 мин

12K

Блог компании NtechLabАлгоритмы * Обработка изображений *

Мы хотим познакомить вас с самым авторитетным на сегодняшний день «чемпионатом мира» по распознаванию лиц, NIST Face Recognition Vendor Test (FRVT) — что он из себя представляет, для чего создан, как проходит соревнование и главное, насколько он действительно важен для разработчиков и бизнеса.

Kwent 17 ноя 2021 в 09:36

Окрашивание изображений

6 мин

8.4K

Блог компании NtechLabОбработка изображений * Машинное обучение *

Технотекст 2021

Статья про окрашивание изображений на основе работы Color2Embed: Fast Exemplar-Based Image Colorization using Color Embeddings. Рассмотрим, как переносить цвет с одной картинки на другую с помощью смеси из U-Net и StyleGAN v2.

+21

Lenny_nn 3 ноя 2021 в 10:23

Как на самом деле работает распознавание лиц

15 мин

34K

Блог компании NtechLab

Мы, команда NtechLab, постараемся понятным языком рассказать, из чего на самом деле состоят самые современные алгоритмы распознавания лиц, с которыми каждый из нас сталкивается в повседневной жизни, порассуждаем, на что они способны и на что — пока нет, и попробуем ответить на вопросы о том, когда технология работает хорошо, а когда плохо, и от чего это зависит.

+22

Ferres 20 окт 2021 в 10:10

Препарирование нейронок, или TSNE и кластеризация на терабайтах данных

12 мин

9.8K

Блог компании NtechLabМашинное обучение * Data Mining * Python *

У вас продакшн нейронные сети, терабайты данных? Вам хочется понять, как работает нейронная сеть, но на таком объеме это сложно сделать? Сложно, но можно. Мы в NtechLab находимся именно в той ситуации, когда данных так много, что привычные инструменты интроспекции нейронных сетей становятся не информативны или вовсе не запускаются. У нас нет привычной разметки для обучения атрибутов. Но нам удалось вытащить из нейронной сети достаточно, чтобы классифицировать все имеющиеся данные на понятные человеку и учтенные нейронной сетью атрибуты. В этом посте мы расскажем, как это сделать.

cdump 25 июл 2021 в 12:01

Сборка с Bazel в реальном проекте

6 мин

15K

Блог компании NtechLabТестирование IT-систем * Программирование * Управление разработкой * Системы сборки *

Привет, Хабр.

В этой статье я расскажу о практическом опыте работы с Bazel, утилитой для автоматизации сборки и тестирования софта от Google. Мы, компания NtechLab, разрабатываем платформу видеоаналитики FindFace. Продукт большой и сложный, используется много разных языков программирования и библиотек, соответственно процесс сборки у нас громоздкий. В поисках инструмента, способного упростить и ускорить сборку, мы остановились на Bazel.

vgridnev 14 мая 2021 в 06:01

Что вам стоит попробовать: Правильный подход к тестированию систем видеоаналитики

11 мин

3.2K

Блог компании NtechLabРабота с видео * Анализ и проектирование систем *

Recovery Mode

Привет, Хабр!

Мы - команда пресейл инженеров NtechLab. Мы занимаемся тем, что помогаем нашим потенциальным клиентам и партнерам познакомиться с нашими решениями, научиться ими правильно пользоваться для достижения поставленных бизнес задач (слишком официально получилось, да). В рамках нашего корпоративного блога мы будем публиковать статьи в рубрике “Байки от нашего пресейла” (рабочее название, предложения в комментах приветствуются), в которых будем делиться веселыми и поучительными примерами из нашей практики. Правда, первая статья получилась достаточно серьезной, но зато очень важной для понимания основных ошибок, которые допускают компании на этапе тестирования систем видеоаналитики и делают наши рабочие будни сложными. Дальше будет веселее.

Kwent 8 дек 2020 в 06:02

Не царская у тебя физиономия! Функции потерь для задачи распознавания лиц

10 мин

26K

Блог компании NtechLabМашинное обучение * Обработка изображений *

Кадр из фильма "Иван Васильевич меняет профессию"

Помните этот момент из легендарного произведения Гайдая? Удивительно, насколько по-разному может восприниматься один и тот же человек с одним и тем же лицом. А когда речь идет о миллионах разных людей и нужно найти одного единственного — даже человек уже бессилен, а сверточные нейросети продолжают справляться. Такое большое количество лиц вынуждает искать новые подходы к разграничению. Один из таких подходов — модификации функций потерь, которые помогают нам не потонуть в огромных датасетах при распознавании лиц, довольно точно определяя, кто есть кто.

Под катом мы рассмотрим различные модификации кросс-энтропии для задачи распознавания лиц.

Читать дальше →

+15

dadalotta 30 мая 2017 в 14:52

Оценка качества алгоритмов распознавания лиц

15 мин

29K

Блог компании NtechLabBig Data * Алгоритмы * Машинное обучение * Обработка изображений *

Recovery Mode

Привет, Хабр!

Мы, в компании NtechLab, занимаемся исследованиями и разработкой продуктов в области распознавания лиц. В процессе внедрения наших решений мы часто сталкиваемся с тем, что заказчики не очень ясно представляют себе требования к точности алгоритма, поэтому и тестирование того или иного решения для их задачи даётся с трудом. Чтобы исправить ситуацию, мы разработали краткое пособие, описывающее основные метрики и подходы к тестированию, которыми хотелось бы поделиться с сообществом Хабра.

Читать дальше →

+18