Вадим @wadik69

Пользователь

Профиль Публикации 12Комментарии 103Закладки 281

olgatrofimova96 3 окт в 16:22

Ищем потерявшихся питомцев с помощью нейросетей

Простой

10 мин

Блог компании NtechLabОбработка изображений*Машинное обучение*Искусственный интеллект

Кейс

Представьте себе, ваш питомец вдруг ~~сбежал~~ отправился в увлекательное путешествие по соседским дворам. Паника, нервы, поиски, бумажные объявления... И хорошо, если ваш пушистик чипирован, но ведь о таком заботятся не все. Можно пойти шерстить порталы с потеряшками, но где искать? Как они работают? Тот еще квест! Хотелось бы автоматизировать этот поиск и здесь как нельзя кстати подойдут нейросети. Мы обучили сеточки для детектирования и распознавания мордочек, которые могут стать основой для удобного сервиса поиска потерявшихся животных.

Мы запилили удобного демо-бота с этими сеточками, он называется FindPet. И теперь с удовольствием представляем его вам и рассказываем, как мы его создавали.

+15

rukhi7 3 окт в 05:57

Почему микросервисы лучше компонент или как деградируют идеи в IT

7 мин

7.2K

Микросервисы*ООП*Программирование*Проектирование и рефакторинг*Анализ и проектирование систем*

Мнение

Попробуем начать с цитаты:

При современных темпах развития индустрии программирования приложениям нельзя оставаться застывшими. Разработчики должны найти способ вдохнуть новую жизнь в программы, которые уже поставлены пользователям. Решение состоит в том, чтобы разбить монолитное приложение на отдельные части, или микросервисы (рис. 1).

...

Традиционно приложение состояло из отдельных файлов, модулей или классов, которые компилировались и компоновались в единое целое. Разработка приложений из микросервисов — так называемых приложений микросервисной архитектуры — происходит совершенно иначе. Микросервис подобен миниприложению; он поставляется пользователю как двоичный код, скомпилированный и готовый к использованию. Единого целого больше нет. Его место занимают специализированные микросервисы, которые подключаются во время выполнения к другим микросервисам, формируя приложение. Модификация или расширение приложения сводится просто к замене одного из составляющих его микросервисов новой версией.

Если интересно откуда эта цитата и что с ней не так прошу под кат.

+15

badcasedaily1 2 окт в 21:08

Как проверить свои модели ONNX на Python: кратко

Простой

4 мин

788

Блог компании OTUSМашинное обучение*

Обзор

Привет, Хабр!

В этой статье разберем, что такое ONNX, как экспортировать модели в этот универсальный формат и, что самое главное, как протестировать их с помощью Python.

+11

ta2024 3 окт в 09:00

Как рекламировать IT-продукт, на который нет спроса? У сервиса видеонаблюдения получилось и лиды выросли в 4 раза

Простой

9 мин

909

Блог компании МАКО DIGITALПовышение конверсии*Интернет-маркетинг*Веб-аналитика*Контекстная реклама*

Кейс

Как продвигать сервис видеонаблюдения, если ЦА даже не понимает, что ей нужна такая услуга? Где искать точки роста без увеличения стоимости лида и кровавой конкуренции? Сервис видеонаблюдения нашел новых клиентов с помощью контекстной рекламы, превратил их в постоянных и вырос в 4 раза.

+13

isachenkoroma 3 окт в 12:00

VLM в Нейро: как мы создавали мультимодальную нейросеть для поиска по картинкам

11 мин

2.7K

Блог компании ЯндексМашинное обучение*Natural Language Processing*Поисковые технологии*Алгоритмы*

Сегодня у Поиска большое обновление. Например, ответы Нейро теперь будут появляться сразу в поисковых результатах — для тех запросов, где это полезно и экономит время. Но в рамках этой статьи нас интересует другая часть обновления: Нейро поможет найти ответы в Поиске по картинкам и в Умной камере — с помощью новой мультимодальной модели Яндекса. Пользователь может не только узнать, что изображено на картинке, но и задать вопрос по каждой её детали. Например, гуляя по музею, можно сфотографировать натюрморт голландского живописца и спросить, что символизирует тот или иной предмет на картине.

Меня зовут Роман Исаченко, я работаю в команде компьютерного зрения Яндекса. В этой статье я расскажу, что такое визуально‑текстовые мультимодальные модели (Visual Language Models или VLM), как у нас в Яндексе организован процесс их обучения и какая у них архитектура. Вы узнаете, как Нейро работал с картинками и текстами раньше, и что изменилось с появлением VLM.

+33

Arseny_Info 20 фев 2019 в 14:25

Kaggle-подходы для CV в проде: внедрить нельзя выпилить

6 мин

12K

Блог компании Open Data ScienceИскусственный интеллектМашинное обучение*Обработка изображений*Управление проектами*

Среди дата сайнтистов ведется немало холиваров, и один из них касается соревновательного машинного обучения. Действительно ли успехи на Kaggle показывают способности специалиста решать типичные рабочие задачи? Арсений arseny_info (R&D Team Lead @ WANNABY, Kaggle Master, далее в тексте A.) и Артур n01z3 (Head of Computer Vision @ X5 Retail Group, Kaggle Grandmaster, далее в тексте N.) отмасштабировали холивар на новый уровень: вместо очередного обсуждения в чате взяли микрофоны и устроили публичное обсуждение на митапе, по мотивам которого и родилась эта статья.

Читать дальше →

+52

fartuk 16 авг 2017 в 18:04

Kaggle: анализ местности Амазонки по спутниковым снимкам

6 мин

12K

Алгоритмы*Машинное обучение*Data Mining*Python*

Из песочницы

Недавно на kaggle.com проходило соревнование Planet understanding the amazon from space
До этого распознаванием изображений не занимался, поэтому подумал, что это отличный шанс научиться работать с картинками. Тем более, что по заверениям людей в чатике, порог вхождения был очень низкий, кто-то даже прозвал датасет «MNIST на стероидах».

Читать дальше →

+25

Ilya12c 24 авг 2023 в 13:29

Kaggle для футболистов. Разбираем подходы призеров соревнований по детекции столкновений (1 и 2 место)

Средний

8 мин

2.1K

Блог компании Magnus TechОбработка изображений*Машинное обучение*Алгоритмы*Data Engineering*

Обзор

Продолжаем разбирать подходы призеров Kaggle-соревнований от американской национальной футбольной лиги (NFL). Участники этого челленджа детектировали столкновения игроков в американском футболе, анализируя данные с видеокамер и датчиков, прикрепленных к форме футболистов. В продолжении первой части статьи расскажу про самые успешные подходы к этой задаче.

Читать дальше →

+21

artemtprv 21 фев в 01:02

О чем говорят руки. 2 место на соревновании Kaggle + код решения

Средний

13 мин

5.7K

Python*Разработка мобильных приложений*Алгоритмы*Машинное обучение*Искусственный интеллект

Из песочницы

Приветствую всех читателей! Меня зовут Артем Топоров, и сегодня я хочу поделиться с вами своим опытом участия в соревновании по распознаванию жестового языка, организованном компанией Google. На этом соревновании, собравшем 1139 команд со всего мира, нам удалось занять 2 место. Расскажу как мы вместе с Николаем Форратом и Xun Zhao разработали ML алгоритм для мобильных устройств, едва не заняли первое место и при чем тут спектрограммы. Вы можете использовать наш код, так как он распространяется под лицензией Apache 2.0.

+47

N01Z3 14 июн 2018 в 14:01

Kaggle: Amazon from Space — трюки и хаки при обучении нейросетей

9 мин

19K

Блог компании Open Data SciencePython*Алгоритмы*Машинное обучение*Обработка изображений*

Летом прошлого года закончилось соревнование на площадке kaggle, которое было посвящено классификации спутниковых снимков лесов Амазонки. Наша команда заняла 7 место из 900+ участников. Не смотря на то, что соревнование закончилось давно, почти все приемы нашего решения применимы до сих пор, причём не только для соревнований, но и для обучения нейросетей для прода. За подробностями под кат.

Читать дальше →

+56

ZlodeiBaal 7 авг 2016 в 22:00

Kaggle – наша экскурсия в царство оверфита

19 мин

38K

Алгоритмы*Анализ и проектирование систем*Машинное обучение*Обработка изображений*

Туториал

Kaggle — это платформа для проведения конкурсов по машинному обучению. На Хабре частенько пишут про неё: 1, 2, 3, 4, и.т.д. Конкурсы на Kaggle интересные и практичные. Первые места обычно сопровождаются неплохими призовыми (топовые конкурсы — более 100к долларов). В последнее время на Kaggle предлагали распознавать:

И многое-многое другое.

Мне давно хотелось попробовать, но что-то всё время мешало. Я разрабатывал много систем, связанных с обработкой изображений: тематика близка. Навыки более лежат в практической части и классических Computer Vision (CV) алгоритмах, чем в современных Machine Learning техниках, так что было интересно оценить свои знания на мировом уровне плюс подтянуть понимание свёрточных сетей.

И вот внезапно всё сложилось. Выпало пару недель не очень напряжённого графика. На kaggle проходил интересный конкурс по близкой тематике.Я обновил себе комп. А самое главное — подбил vasyutka и Nikkolo на то, чтобы составить компанию.

Сразу скажу, что феерических результатов мы не достигли. Но 18 место из 1.5 тысяч участников я считаю неплохим. А учитывая, что это наш первый опыт участия в kaggle, что из 3х месяц конкурса мы участвовали лишь 2.5 недели, что все результаты получены на одной единственной видеокарте — мне кажется, что мы хорошо выступили.

О чём будет эта статья? Во-первых, про саму задачу и наш метод её решения. Во-вторых, про процесс решения CV задач. Я писал достаточно много статей на хабре о машинном зрении(1,2,3), но писанину и теорию всегда лучше подкреплять примером. А писать статьи по какой-то коммерческой задаче по очевидным причинам нельзя. Теперь наконец расскажу про процесс. Тем более что тут он самый обычный, хорошо иллюстрирующий как задачи решаются. В-третьих, статья про то, что идёт после решения идеализированной задаче в вакууме: что будет когда задача столкнётся с реальностью.

Читать дальше →

+64

ternaus 7 апр 2017 в 14:00

Kaggle: Британские спутниковые снимки. Как мы взяли третье место

22 мин

42K

Блог компании Open Data ScienceОбработка изображений*Машинное обучение*Алгоритмы*Python*

Сразу оговорюсь, что данный текст — это не сухая выжимка основных идей с красивыми графиками и обилием технических терминов (такой текст называется научной статьей и я его обязательно напишу, но потом, когда нам заплатят призовые $20000, а то, не дай бог, начнутся разговоры про лицензию, авторские права и прочее.) (UPD: https://arxiv.org/abs/1706.06169). К моему сожалению, пока устаканиваются все детали, мы не можем поделиться кодом, который написали под эту задачу, так как хотим получить деньги. Как всё утрясётся — обязательно займемся этим вопросом. (UPD: https://github.com/ternaus/kaggle_dstl_submission)

Так вот, данный текст — это скорее байки по мотивам, в которых, с одной стороны, всё — правда, а с другой, обилие лирических отступлений и прочей отсебятины не позволяет рассматривать его как что-то наукоемкое, а скорее просто как полезное и увлекательное чтиво, цель которого показать, как может происходить процесс работы над задачами в дисциплине соревновательного машинного обучения. Кроме того, в тексте достаточно много лексикона, который специфичен для Kaggle и что-то я буду по ходу объяснять, а что-то оставлю так, например, вопрос про гусей раскрыт не будет.

+74

N01Z3 5 июл 2018 в 14:05

kaggle: IEEE's Camera Model Identification

7 мин

6.5K

Блог компании Open Data ScienceУправление разработкой*Обработка изображений*Машинное обучение*Python*

В конце зимы этого года прошло соревнование IEEE's Signal Processing Society — Camera Model Identification. Я участвовал в этом командном соревновании в качестве ментора. Об альтернативном способе формирования команды, решении и втором этапе под катом.

Читать дальше →

+34

temakone 18 сен 2017 в 14:19

Kaggle: как наши сеточки считали морских львов на Алеутских островах

11 мин

26K

Блог компании Open Data SciencePython*Алгоритмы*Машинное обучение*Обработка изображений*

header_im

Привет, Коллеги!

27 июня закончилось соревнование на Kaggle по подсчёту морских львов (сивучей) на аэрофотоснимках NOAA Fisheries Steller Sea Lions Population Count. В нем состязались 385 команд. Хочу поделиться с вами историей нашего участия в челлендже и (почти) победой в нём.

Читать дальше →

+61

snakers4 22 апр 2018 в 17:55

Применяем Deep Watershed Transform в соревновании Kaggle Data Science Bowl 2018

7 мин

8.4K

Data Mining*Python*Машинное обучение*Обработка изображений*

Применяем Deep Watershed Transform в соревновании Kaggle Data Science Bowl 2018

Представляем вам перевод статьи по ссылке и оригинальный докеризированный код. Данное решение позволяет попасть примерно в топ-100 на приватном лидерборде на втором этапе конкурса среди общего числа участников в районе нескольких тысяч, используя только одну модель на одном фолде без ансамблей и без дополнительного пост-процессинга. С учетом нестабильности целевой метрики на соревновании, я полагаю, что добавление нескольких описанных ниже фишек в принципе может также сильно улучшить и этот результат, если вы захотите использовать подобное решение для своих задач.

описание пайплайна решения

Читать дальше →

+27

GMorozov 17 сен 2015 в 15:20

Разбор задачи Digit Recognizer соревнования Kaggle

11 мин

14K

Блог компании MLClassПрограммирование*Математика*Data Mining*Big Data*

Привет, хабр!

Как и обещал, продолжаю публикацию разборов задач, которые я прорешал за время работы с ребятами из MLClass.ru. В этот раз мы разберем метод главных компонент на примере известной задачи распознавания цифр Digit Recognizer с платформы Kaggle. Статья будет полезна новичкам, которые еще только начинают изучать анализ данных. Кстати, еще не поздно записаться на курс Прикладной анализ данных, получив возможность максимально быстро прокачаться в данной области.

Читать дальше →

+17

Leono 6 авг 2017 в 17:18

Лекция Владимира Игловикова на тренировке Яндекса по машинному обучению

18 мин

13K

Блог компании ЯндексМашинное обучение*Ненормальное программирование*Спортивное программирование*

Скорее всего, вы слышали об авторе этой лекции. Владимир ternaus Игловиков занял второе место в британском Data Science Challenge, но организаторы конкурса не стали выплачивать ему денежный приз из-за его российского гражданства. Затем наши коллеги из Mail.Ru Group взяли выплату приза на себя, а Владимир, в свою очередь, попросил перечислить деньги в Российский Научный Фонд. История получила широкий охват в СМИ.

Спустя несколько недель Владимир выступил на одной из тренировок Яндекса по машинному обучению. Он рассказал о своём подходе к участию в конкурсах, о сути Data Science Challenge и о решении, которое позволило ему занять второе место.

+41

alimbekovR 16 фев 2022 в 11:16

Как мы меняем Anti-spoofing модель с вендорских решений на собственные

5 мин

3.8K

Блог компании Beeline КазахстанИскусственный интеллектНаучно-популярноеМашинное обучение*Информационная безопасность*

Привет! Меня зовут Ренат Алимбеков, я занимаюсь задачами, связанными с Computer Vision в Beeline Казахстан. Сейчас моя работа направлена на Anti-spoofing.

Моя основная задача сейчас — заменить вендорские решения в продуктах Beeline Казахстан на собственные. В этой статье расскажу про решение, которое будет использоваться в нашем цифровом мобильном операторе izi и необанке Simply.

В этих продуктах весь сервис предоставляется онлайн, и задача удаленной биометрии — позволить сделать все в одном приложении без визита в офис.

Еще одно применение решений — симкоматы. Мы поставили несколько симкоматов в офисах Beeline, и теперь перевыпуск сим-карты можно сделать самостоятельно, а мы можем быть уверены, что это не мошеннические действия.

Го отражать атаки

+10

yorko 16 июл в 12:11

В 48 собесах от оффера в Гугл

Средний

21 мин

16K

Блог компании Open Data ScienceData Mining*Машинное обучение*Карьера в IT-индустрииNatural Language Processing*

Обзор

Здравствуй, хабр! Что-то я давно не писал, отбился от рук, а ведь когда-то мы целый курс машинного обучения на Хабре вели. Расскажу про свой недавний заход по собесам, что спрашивали, какие выводы сделал. Контекст: Applied Machine Learning science (в том числе этот ваш Generative AI), Нидерланды, уровень синьор+. Я долго получал отказы, старался не унывать и в конце таки нашил лычку Staff GenAI Field Solutions Architect в Google Cloud. Тут поделюсь статистикой собесов, полезными ресурсами и, конечно, всякими советами.

+66