Articles / Bookmarks / Profile of nikkymen / Habr

How to become an author

Кожанов Никита Юрьевич @nikkymen

Computer Vision, Machine Learning

Profile Publications Comments 7Bookmarks 1.1K

rotor Sep 22 2022 at 14:03

Как полюбить задачи регрессии

5 min

7.2K

Data Mining*Algorithms*Machine learning*Data Engineering*

Data Mining Season

У задач классификации, в отличии от задач регрессии, есть одно очень приятное свойство:
большинство ML алгоритмов решения задач классификации выдают не просто ответ, а некоторую оценку уверенности модели в ответе. То есть помимо метрик самой модели мы обладаем оценкой вероятности для конкретного ответа на конкретном примере. Это здорово помогает в принятии решений.
Неправда ли хотелось бы иметь что-то такое и для задач регресии?

Читать далее

+8

UtrobinMV Sep 22 2022 at 12:21

Как создать переводчик, который переводит лучше, чем Google Translate

8 min

30K

Data Mining*Machine learning*Artificial IntelligenceNatural Language Processing*Data Engineering*

Tutorial

Data Mining Season

Помню, как еще в школе на Basic я писал программу-переводчик. И это было то время, когда ты сам составлял словарь, зашивал перевод каждого слова, а затем разбивал строки на слова и переводил каждое слово в отдельности. В то время я, конечно же, не мог и представить, как сильно продвинутся технологии, и программы-переводчики станут в основе использовать механизмы глубокого обучения с архитектурой трансформера и блоками внимания.

В этот раз я решил окунуться немного в прошлое и сделать то, что хорошо сделать тогда у меня не получилось.

Читать далее

+61

ternaus Sep 21 2022 at 01:48

Similar images: API

4 min

4.5K

Python*Image processing*Machine learning*Artificial Intelligence

Кортокая версия.

Я набил API, который позволяеи искать картинки похожие на искомую.

API бесплатный, на один запрос выдает до 50 похожих картинок.

В базе данных 18 миллионов изображений. Надеюсь, в ближайшее время, добавлю еще 50M.

API: LINK

Web Demo: LINK. Можно загрузить свою картинку или воспользоваться текстовым поиском. Можно кликать на картинки в результате поиска и смотреть что найдет по ней. Хороший вопрос за сколько шагов можно дойти от чего-то невинного до порнухи или хотя бы обнаженки.

Читать далее

+19

NewTechAudit Sep 20 2022 at 14:04

Решаем судоку при помощи компьютерного зрения

5 min

6.3K

Machine learning*Python*Programming*Logic games

Tutorial

Привет, Хабр! Поиграем в судоку?

Читать далее

+13

matkov Sep 16 2022 at 17:20

Самообучающийся трекер объектов: как отслеживать цель в изменчивых условиях сцены

16 min

13K

Data Mining*Machine learning*

Data Mining Season

Technotext 2022

Специалисты по компьютерному зрению не один десяток лет бьются над трекингом объектов. Они перепробовали многое: от старой-доброй оценки движения оптическим потоком до сетей-трансформеров.

Есть один подход к трекингу, широко известный на западе, но о котором мало пишут по-русски: Incremental Visual Tracker (IVT). Это трекер объектов на основе модифицированного метода главных компонент: он самообучается на ходу и адаптируется к изменчивым условиям.

Давайте исследуем физиологию этого трекера, чем он интересен и где его можно применить — а затем изучим проблемы его реализации и нюансы использования. Под катом ссылка на репозиторий и много математики.

Читать далее

+13

MaxRokatansky Sep 16 2022 at 16:11

Упрощаем код с помощью if constexpr и концептов C++17/C++20

14 min

17K

OTUS corporate blogProgramming*C++*

Translation

До C++17 у нас было несколько довольно неэлегантных способов написать static if (if, который работает во время компиляции). Например, мы можем использовать статическую диспетчеризацию или SFINAE. К счастью, ситуация изменилась к лучшему, ведь теперь мы можем воспользоваться для этого if constexpr и концептами C++20!

Ну что ж, давайте разберемся, как мы можем использовать это в качестве замены std::enable_if кода!

Читать далее

+9

Deleted-user Sep 15 2022 at 21:07

Создаем личное файловое облако легко и просто (и дешево)

13 min

135K

HostingConfiguring Linux*System administration*Cloud services*

Tutorial

А сегодня мы с вами ~~быстро и решительно~~ легко и просто поднимем свое личное файловое облако типа Google Drive или Яндекс.Диск, а если повезет, то еще и очень дешево.

Зачем? Ну, например, потому что не хотим зависеть от корпораций с их кабальными лицензионными соглашениями и сменой условий задним числом. Или потому что нам хочется приватности. Или просто потому что можем. А бонусом на нашем сервере вы потом сможете еще установить VPN или прокси для доступа к запрещенным сайтам, или поднять простенький веб-сайтик.

Я специально будут рассказывать все максимально подробно и пошагово, чтобы даже люди без большого опыта системного администрирования смогли все повторить. В наше время, благодаря развитому инструментарию, такому как docker и snap, установить и настроить все что нужно можно очень быстро всего лишь несколькими командами.

Читать далее

+84

kucev Sep 14 2022 at 22:00

Руководство по Human Pose Estimation

12 min

12K

Big Data*Data Mining*Artificial IntelligenceMachine learning*Image processing*

Translation

Обычно эту задачу решают при помощи глубокого обучения.

Это одна из самых интересных областей исследований, получившая популярность благодаря своей полезности и универсальности — она находит применение в широком спектре сфер, в том числе в гейминге, здравоохранении, AR и спорте.

В этой статье приведён исчерпывающий обзор определения положения тела человека (Human Pose Estimation, HPE) и того, как оно работает. Также в ней рассматриваются различные подходы к решению задачи HPE — классические методы и методы на основе глубокого обучения, метрики и способы оценки, а также многое другое.

Читать дальше →

+19

arch1baald Sep 14 2022 at 17:11

Шерудим под капотом Stable Diffusion

10 min

34K

Image processing*Machine learning*Artificial IntelligenceNatural Language Processing*

Tutorial

Вероятно вы уже слышали про успехи нейросетей в генерации картинок по текстовому описанию.

Я решил разобраться, и заодно сделать небольшой туториал, по архитектуре модели Stable Diffusion. Сегодня мы не будем глубоко погружаться в математику и процесс тренировки. Вместо этого сфокусируемся на применении и устройстве основных компонент: UNet, VAE, CLIP.

Читать далее

+81

MaxRokatansky Sep 7 2022 at 12:26

Пользовательские типы и std::format в C++20

8 min

17K

OTUS corporate blogProgramming*C++*

Translation

std::format — очень полезное (и серьезное) нововведение C++20, позволяющее нам форматировать текст в строки удобным и эффективным образом. Оно привносит в язык форматирование в стиле Python в сочетании с безопасностью и простотой использования.

В этой статье я расскажу, как реализовать пользовательские средства форматирования (форматтеры) в соответствии с новой std::format архитектурой.

Читать далее

+12

Vlomme Aug 15 2022 at 11:45

В IT в 30. Как я стал solo Kaggle Grandmaster, устроился на работу, но так и не стал программистом

10 min

73K

Game development*Machine learning*IT career

Всем привет, меня зовут Крамаренко Владислав. В этом году мне исполнилось 30 лет, а также случилось много событий, в том числе и позитивных. Во первых, я устроился на вторую в жизни работу(и первую в айти), а во вторых, стал грандмастером. Это сложный путь, на котором было несколько ключевых решений, которые привели меня к себе нынешнему. Им я и поделюсь далее, начав с детства.

Читать далее

+87

Sagidullin Aug 12 2022 at 17:31

5 отличных мини-ПК для дома и офиса: новые устройства августа 2022 года

4 min

22K

Selectel corporate blogGadgetsComputer hardwareDesktop PC's

Производители миниатюрных десктопов, несмотря на все проблемы электронной отрасли, продолжают выпускать интересные новые устройства. Среди них есть как относительно мощные, так и те, что позволяют лишь работать с документами и серфить. Но что те, что другие могут оказаться полезными для многих из нас. Понятно, что в подборку попали не все новинки, но если у вас есть собственный претендент для этого материала — пишите в комментариях, обсудим!

Читать дальше →

+33

severstal Aug 11 2022 at 14:14

Дроны на «Северстали» или как мы цифровизовали маркшейдинг

8 min

7.6K

Северсталь corporate blogSystem Analysis and Design*Industrial Programming*Product Management*Systems engineering*

Когда любишь свою работу, идея по ее улучшению может прийти в голову в любой момент. Так и произошло в 2016 году, когда я увидел обычный бытовой дрон, который соседи по даче купили своему ребенку. Я попробовал поуправлять квадрокоптером на участке, а он в какой-то момент улетел за сарай, где в узком проходе между забором лежали доски. С той точки, где я находился, их было не видно, но дрон их снял на камеру с отличным качеством. И вдруг я понял: коптеры можно использовать для осмотра и съемки труднодоступных конструкций на территории предприятия!

Меня зовут Горбунов Михаил, я — главный инженер центра «Домнаремонт», который входит в дивизион «Северсталь». Сегодня я расскажу о применении беспилотников для сбора информации и контроля некоторых видов работ на комбинате.

Полетели!

+22

ualeks Jul 30 2022 at 15:36

Использование Redis для работы с геоданными

6 min

7.9K

NoSQL*Data storage*Data storages*Data Engineering*

Translation

Работа с геопространственными данными заведомо сложная задача, хотя бы потому что широта и долгота это числа с плавающей запятой и они должны быть очень высокоточными. К тому же, казалось бы, широта и долгота могут быть представлены в виде сетки, но на самом деле нет, не могут, просто потому что Земля не плоская, а математика - сложная наука.

Читать далее

+17

MatasDragonV Jul 27 2022 at 22:09

Временная релокация в Турцию для российского айтишника — основные вопросы, подводные камни, лайфхаки (обновляемая)

35 min

25K

Сколько же статей на эту тему написано и вот опять!

- подчеркнет возмущенный, искушенный читатель хабра. Поэтому небольшой "дисклеймер" всем кто считает что описанное в статье давно известно, пользуется этим много времени, и я для них "изобретаю велосипед", вы огромные молодцы, всегда находитесь на гребне технологий и секретов и не отступайте с него! Статья же по большей части является "сборной солянкой" решения проблем, возникающих для любого неподготовленного человека сферы IT при пусть даже временной релокации в Турцию, моей целью являлось собрать максимум информации в сжатом виде в одном месте.

Читать далее

+14

Aleron75 Jul 26 2022 at 12:00

Получил доступ к Dalle-2. Вы не поверите, что может нарисовать машина… Дизайнеры больше не нужны

4 min

149K

RUVDS.com corporate blogBig Data*Machine learning*Popular scienceImage processing*

Текст генерации: furry monster with green eyes looking at us, the word «habrahabr» in the background, digital art, blue background, 3d

Привет, чемпион!

Недавно мне посчастливилось стать обладателем доступа к API Dalle-2. Если ты ещё не слышал про Dalle, то это такая CLIP-архитектура, обученная на огромном корпусе пар текст-изображение. Иначе говоря — она умеет генерировать очень качественные изображения из текста. Отличить результаты генерации от рисунков человека иногда просто невозможно! Это одновременно впечатляет и в то же время — немного шокирует.

По сравнению с предыдущей версией — DALL-E 2 умеет генерировать изображения в более высоком разрешении (1024×1024 пикселей, что в 16 раз превышает разрешение в предыдущей версии модели) да ещё и намного быстрее. Более того, DALL-E 2 позволяет редактировать уже существующие изображения.

Нет больше терпения ждать, давайте же опробуем её!

Читать дальше →

+220

Mastersland Jul 20 2022 at 12:42

Обхода блокировок много не бывает на роутерах Keenetic

23 min

170K

Information Security*Instant Messaging*Python*Network technologies*

С помощью действий, описанных в этой статье, Вы сможете подключить все устройства домашней сети (телефоны, смарт-тв, компьютеры и ноутбуки и другие "домашние" устройства) к данному обходу блокировок, а также подключаться к Вашему роутеру не из дома и пользоваться его обходом блокировок для доступа к любимым сайтам и приложениям. Кроме того, из обеих этих сетей (домашней и через подключение к роутеру), из любого браузера можно будет пользоваться onion-сайтами.

В данной статье будет описана работа телеграм-бота, написанного на python. С его помощью будет возможна установка данного обхода с небольшими предварительными настройками, а также работа со списками блокировок.

Читать далее

+33

JetHabr Jul 19 2022 at 11:07

Бэкдор в ML-моделях. Врага надо знать «в лицо»

4 min

3.7K

Инфосистемы Джет corporate blogInformation Security*Machine learning*Artificial Intelligence

Основная опасность бэкдоров заключается в том, что их очень сложно вычислить — это не вложенный кусок вредоносного кода, а зашитый при обучении модели паттерн поведения. Open Source модели или даже модели, которые были разработаны для заказчика «вовне», могут быть опасны тем, что они содержат подобные уязвимости. Зачем они нужны и что из себя представляют, рассказывают дата-сайнтисты «Инфосистемы Джет».

Узнать все

+20

Digital_Design Jun 24 2022 at 18:21

Воспроизводимость ML экспериментов с помощью MLflow project

12 min

5.6K

Digital Design corporate blogOpen source*Python*Machine learning*

Tutorial

Всем привет! Меня зовут Игорь Дергунов и я руководитель инновационной лаборатории Digital Design, которая занимается оптимизацией бизнес-процессов с помощью методов машинного обучения. В процессе работы над проектами в данной сфере быстро приходит осознание необходимости учета и структурирования проводимых экспериментов. В нашем случае мы воспользовались инструментом MLflow, который предоставляет функциональность для отслеживания экспериментов и управления жизненным циклом моделей машинного обучения.

И все шло хорошо, результаты проверки гипотез (параметры обучения, метрики, артефакты и модели) сохранялись, их было удобно наглядно сравнивать, и все были довольны. Так продолжалось достаточно долгое время, пока не возникла необходимость вернуться к эксперименту, который выполнялся какое-то время назад и был приостановлен.

Читать далее

+2

horpia Jun 24 2022 at 17:31

Отрисовка в браузере большой анимации или как я ушел с mp4 к своему формату видео

17 min

54K

Floor796 corporate blogImage processing*JavaScript*

Поделюсь с вами успешным опытом разработки рендера в браузере большой, постоянно расширяющейся анимационной сцены, состоящей из множества мелких двигающихся объектов, зацикленных в 5 секунд.

Читать далее

+286

3

4 5 ...