Пользователь

Профиль Публикации 3Комментарии 53Закладки 187

CodeDroidX 3 сен 2023 в 07:00

CodeLama в вашей клавиатуре | Локальный Copilot для любого поля ввода

Простой

9 мин

18K

Python*Программирование*Машинное обучение*Разработка под Windows*Искусственный интеллект

Туториал

Стою я значит утром (около 2 часов дня) возле кофеварки и листаю ленту хабра, а там CodeLama вышла. Copilot для бедных это или панацея в мире локальных текстовых моделей? Попытаюсь не отвечать на этот вопрос, ведь ваши соседи снизу утонут в воде, которая сейчас льётся из экрана.
Читать далее - на свой страх и риск. Статья писалась спинным мозгом и глубокой ночью, как следствие я получил натянутую на глобус сущность, которую можно инкапсулировать в технотекст, что бы она вызывала меньше подозрений у случайного читателя. Ну вы поняли уровень, верно?
Предлагаю обойтись кратким вступлением и перейти сразу к делу.

Сразу к делу

+48

ilyaprok 10 июл 2021 в 14:32

Фильтр Калмана: разбор навигационной системы БПЛА + исходный код

14 мин

26K

C++*Алгоритмы*Математика*Unity*Робототехника

Из песочницы

В статье я бы хотел объяснить принципиальную разницу между фильтром Калмана (ФК) и классическими фильтрами, кратко рассмотреть преимущество выбранного ФК поделиться опытом использования данного ФК в во встраиваемой системе квадрокоптера для навигации на основе инерциального и ГНСС датчиков и поделиться исходным кодом с демкой для самостоятельного изучения.

+29

Nikolay_nc 2 сен 2023 в 10:46

Пережевывая Матрицу Несоответствий — Confusion Matrix

Простой

7 мин

13K

Машинное обучение*Статистика в ITИнтервью

Из песочницы

Понятие Confusion Matrix является довольно простым в объяснении, но при этом начинающим Data Scientist-специалистам бывает порой нелегко разобраться в отношениях True Positive (TP), False Positive (FP), True Negative (TN), False Negative (FN) — кирпичиками, составляющими данную матрицу. Цель этой статьи познакомить читателя с альтернативным представлением Матрицы Ошибок. Данный способ, по мнению автора, является наиболее наивным методом графического восприятия самой Матрицы Несоответствий, не предполагающий запоминания самой таблицы матрицы. Данный подход позволит легко ориентироваться в выводах, основанных на комбинации элементов Confusion Matrix, глубже понять проблему дисбаланса классов в задачах классификации.

AndreyWinter 2 сен 2023 в 18:20

Оптика в техническом зрении. Лекция 2: Аберрации

Средний

17 мин

11K

Научно-популярноеИнженерные системы*

FAQ

Привет, Хабр!

Меня зовут Андрей, я – специалист по оптическим системам, оптик и инженер-конструктор в одном лице.

В этой статье я продолжу публиковать фрагменты курса основ прикладной оптики, созданный несколько лет назад для внутреннего обучения CV-разработчиков организации.

Текущая лекция – не обязательная. Она не предлагает конкретных формул и способов решения, но даёт лучшее понимание того, как именно складывается изображение после объектива. Соприкасающимся с оптикой людям рекомендую ей прочитать. Более короткого и наглядного описания аберраций в русскоязычном интернете нет.

+40

ru_vds 2 сен 2023 в 13:00

Лучший софт для автоматизации скриншотов

Простой

6 мин

29K

Информационная безопасность*Обработка изображений*Резервное копирование*Блог компании RUVDS.comСофт

Кейс

Такие скриншоты присылала Таня

У нас была знакомая девушка Таня (имя изменено), которая делала скриншоты ПК только смартфоном. То есть фотографировала экран — и присылала сделанную фотографию. Всё с телефончика, очень удобно…

В то же время есть масса эффективных инструментов для сохранения копии экрана каждую секунду или минуту, хранения архива, поиска по нему, автоматического копирования на удалённый хостинг и т. д.

Читать дальше →

+45

ThomasAlva 17 апр 2020 в 01:27

Руководство по FFmpeg libav

24 мин

92K

Работа с видео*Программирование*Визуализация данных*Блог компании EdisonУчебный процесс в IT

Перевод

Долго искал книгу, в которой было бы разжёвано, как использовать FFmpeg-подобную библиотеку, известную как libav (название расшифровывается как library audio video). Обнаружил учебник «Как написать видеоплеер и уложиться в менее чем тысячу строк». К сожалению, информация там устаревшая, так что пришлось создавать мануал своими силами.

Большая часть кода будет на C, однако не волнуйтесь: Вы легко всё поймёте и сможете применить на любимом языке. У FFmpeg libav уйма привязок ко многим языкам (в том числе и к Python и к Go). Но даже если Ваш язык прямой совместимости не имеет, всё равно можно привязаться через ffi (вот пример с Lua).

Начнём с краткого экскурса о том, что такое видео, аудио, кодеки и контейнеры. Затем перейдем к ускоренному курсу, посвященному использованию командной строки FFmpeg, и, наконец, напишем код. Не стесняйтесь переходить сразу в раздел «Тернистый путь изучения FFmpeg libav».

Есть мнение (и не только моё), что потоковое интернет-видео уже приняло эстафету от традиционного телевидения. Как бы то ни было, FFmpeg libav точно достоин изучения.

Используем модель нейросети на C++

Простой

4 мин

15K

C++*Машинное обучение*Искусственный интеллект

Туториал

Большинство туториалов по созданию и использованию моделей нейросетей написаны на Python. Однако для какого-нибудь проекта рано или поздно может понадобится использовать более быстрый и надежный язык для этих задач, например, C++. Эта статья о том, как на C++ можно использовать модель нейросети на примере модели YOLOv8 для детектирования лиц и библиотеки PyTorch.

+18

DewT-Mag 13 июл 2023 в 12:41

Камера, нейронки и дымящийся микро-ПК: дешевая и практичная альтернатива радару

9 мин

4.6K

Алгоритмы*Машинное обучение*ТранспортБлог компании Magnus Tech

Кейс

В этом посте мы расскажем, как дошли до идеи отказа от использования радара при фотовидеофиксации нарушений. А также о том, как: подружили камеры с сверточными нейросетями, научили эту дружную «компанию» отличать грузовики от легковушек, точно фиксировать скорость и направление движения, а заодно засекать проезды на красный свет.

+28

dimanosov007 26 мая 2023 в 10:06

Обучите YOLO NAS пользовательскому набору данных

13 мин

5.9K

Python*Data Mining*Машинное обучение*Искусственный интеллектData Engineering*

Туториал

Перевод

На данный момент YOLO-NAS является новейшей моделью обнаружения объектов YOLO. С самого начала он превосходит все другие модели YOLO по точности. Предварительно обученные модели YOLO-NAS обнаруживают больше объектов с большей точностью по сравнению с предыдущими моделями YOLO. Но как нам обучить YOLO NAS пользовательскому набору данных? Это и будет нашей целью в этой статье – обучить различные модели YOLO NAS пользовательскому набору данных.

igoral 25 мая 2022 в 13:00

Как ускорить Python с помощью C-расширений. Часть 1

9 мин

12K

Python*C*Блог компании МТС

Туториал

Привет, Хабр! Я – Игорь Алимов, ведущий разработчик группы Python в МТС Digital, работаю над продуктами Smart Rollout, B2B портал. В этой статье я расскажу о том, как писать быстрый код на Python с использованием C-расширений и способах победы над GIL.

Интересно? Добро пожаловать под кат!

+17

fruitourist 23 апр 2023 в 16:09

FaceNet: Универсальный эмбеддинг для распознавания и кластеризации лиц

Средний

21 мин

6.7K

Машинное обучение*Искусственный интеллект

Аналитика

Перевод

Несмотря на значительные достижения в области распознавания лиц, эффективная реализация проверки и распознавания лиц в масштабе представляет серьезные трудности для существующих подходов. В данной работе представляется система под названием FaceNet, которая непосредственно обучается отображению изображений лиц в компактное евклидово пространство, где расстояния напрямую соответствуют мере сходства лиц.

CrazyFizik 9 янв 2018 в 08:49

ТАУ для самых маленьких: пример реализации ПИД-регулятора в Unity3D

24 мин

87K

Разработка игр*Алгоритмы*C#*Математика*Unity*

Туториал

Вместо введения

Системы автоматического управления (САУ) предназначены для автоматического изменения одного или нескольких параметров объекта управления с целью установления требуемого режима его работы. САУ обеспечивает поддержание постоянства заданных значений регулируемых параметров или их изменение по заданному закону либо оптимизирует определенные критерии качества управления.

+23

OlegSivchenko 29 сен 2021 в 12:30

Членимая калейдоскопическая сложность. Об устройстве и потенциале фасеточного глаза

7 мин

8.3K

Обработка изображений*Научно-популярноеБиотехнологииВидеотехникаФизика

Некоторое время назад я планировал разместить здесь откровенно антирелигиозную статью и пройтись по излюбленному примеру креационистов, связанному с нечленимой сложностью. Я хотел разобрать казус с отказом признавать эволюцию глаз, но обнаружил на Хабре превосходную статью Вячеслава Пуговкина @ra3vdx, в которой разобрана именно эта проблема. Поэтому я решил изменить акценты и развернуть не менее интересную тему: рассказать об устройстве и бионическом потенциале фасеточного глаза. Давайте об этом поговорим – и начну я, пожалуй, с ваятельницы Лин, главной героини гротескного романа, написанного Чайной Мьевилем.

+24

CopterSpace 31 июл 2019 в 15:31

Вход в Aeronet, эпизод 2: Самонаводящийся дрон

6 мин

7.4K

РобототехникаМультикоптеры

В предыдущей статье мы рассмотрели порядок действий для запуска в воздух автономного виртуального дрона. Под руководством преподавателя по этой инструкции удаётся запустить дрон даже школьникам. Возникает вопрос: а что дальше? Ну, дрон, ну взлетел. Тем более, виртуальный – в игрушках и симуляторах и покрасивее есть нарисованы.

В качестве следующего шага мы предлагаем создать самонаводящийся дрон, способный увидеть свою цель и успешно её достичь. В качестве цели проще всего использовать цветной воздушный шарик.

Такое задание (лопнуть шарик автономным дроном) недавно выполняли команды на секции Аэронет всероссийского Робокросса-2019. На него нас вдохновила песня “Seek and destroy” с дебютного альбома одной весьма популярной во времена моей бурной молодости американской группы.
В последующем цикле статей мы рассмотрим, как научить автономного дрона выполнять нехитрые инструкции из припева вышеупомянутой песенки.

Читать дальше →

CopterSpace 15 окт 2019 в 10:11

Вход в Aeronet, эпизод 4: Отыскать и бабахнуть

3 мин

3.4K

Разработка робототехники*Разработка на Raspberry Pi*РобототехникаМультикоптеры

Туториал

Сегодня мы объединяем программу управления автономным дроном с программой обнаружения шарика, дабы лопнуть уже шарик автономным дроном.

Читать дальше →

mvideo 24 мая 2023 в 16:00

3500 в час с ChatGPT

9 мин

50K

Машинное обучение*Блог компании М.Видео-ЭльдорадоИскусственный интеллект

Кейс

Привет, Хабр! Меня зовут Саша, и я тот самый студент, который написал диплом с помощью ChatGPT за сутки. Всю историю можно почитать на Хабре тут, тут, где всерьез обсуждалась идея лишить меня диплома, и тут, где недоуменно размышляли, что со мной делать. Пока “Антиплагиат” трудится над совершенствованием системы (читать тут), я решил провести вас по пути джедая, использующего силу ChatGPT.

+28

290

hukenovs 21 июн 2022 в 10:30

HaGRID — огромный открытый датасет для распознавания жестов

9 мин

8.2K

Data Mining*Обработка изображений*Машинное обучение*Искусственный интеллектБлог компании SberDevices

Хороший набор данных невероятно важен при обучении нейросетей. Наш датасет изображений с жестами HaGRID (Hand Gesture Recognition Image Dataset) — один из таких. С его помощью можно создать систему распознавания жестов, которая будет отлично работать в совершенно разных ситуациях. Например, жестовое управление можно использовать в видеоконференциях, для управления устройствами умного дома или мультимедийными возможностями автомобиля. Ещё одна важная возможность — создание виртуальных помощников для пользователей с дефектами речи или использующих язык жестов. Ниже рассказываем, как всё это работает, и делимся ссылками на датасет и набор предобученных моделей к нему.

+19

CodeInsideTeam 30 мар 2023 в 16:31

Расчет транспортного потока на основе YOLOv5 и DeepSORT на базе Deepstream

Простой

7 мин

8.1K

Машинное обучение*

Обзор

Cезон machine learning

Хотим сохранить ваше время и нервы с задачей по подсчету трафика на перекрестках.

Ярослав и Никита – наши CV-инженеры, поделились решением, которое всего за 4 шага поможет подойти к релизу с минимальной потерей времени и денег.

Статья будет полезна начинающим CV-инженерам, продуктологам, владельцам IT-продукта, маркетологам и проджект-менеджерам.

+12

DELTA37 8 апр 2022 в 11:34

Разметка именованных сущностей в Label Studio

5 мин

16K

Data Mining*Big Data*Машинное обучение*

Туториал

В предыдущей статье мы уже подробно рассмотрели процесс разметки семантической сегментации в CVAT. Сейчас я подробнее расскажу по NER-разметку в другом популярном open source инструменте Label Studio

Предупреждаю, статья в первую очередь направлена на новичков, которые делают первые шаги в разметке данных. Как и в прошлый раз мы шаг за шагом пройдем путь от установки и настройки проекта до экспорта уже размеченного датасета.

В процессе будем подробнее останавливаться на нюансах связанных с извлечением именованных сущностей и рекомендациях из личного опыта.

Посмотрим, что у тебя там...

DELTA37 9 июн 2022 в 12:44

Как быстро создать обучающий датасет для задач обнаружения объектов YOLO с помощью Label Studio

4 мин

14K

Data Mining*Big Data*Машинное обучение*Data Engineering*

Туториал

Обнаружение объектов — одна из подзадач компьютерного зрения для идентификации определенных объектов. Например, люди, здания, растений, дорожных знаков или транспортные средства на изображениях и видео.

Для создания таких моделей существует множество различных типов алгоритмов, таких, как Scale-invariant feature transform (SIFT), Detectron, RefineDet или You Only Look Once (YOLO). Их часто используют в самых разных отраслях, начиная с автономного вождения и охранных систем, заканчивая автоматизацией на производстве и распознаванием лиц.

Как и с любой моделью машинного обучения, всё начинается с создания обучающего набора данных. Сделать это можно разными способами: можно заказать разметку данных, а можно всё сделать самому.

Конечно, второй вариант займет намного больше времени и сил, но с помощью правильно подобранного ПО можно неплохо упростить задачу. Сейчас я подробно расскажут, как быстро создать обучающий датасет для задач детекции объектов YOLO с помощью Label Studio.

Посмотрим, что у тебя там...

1 2 3

5 6 7 8 9

CodeLama в вашей клавиатуре | Локальный Copilot для любого поля ввода

Фильтр Калмана: разбор навигационной системы БПЛА + исходный код

Пережевывая Матрицу Несоответствий — Confusion Matrix

Оптика в техническом зрении. Лекция 2: Аберрации

Лучший софт для автоматизации скриншотов

Руководство по FFmpeg libav

Оглавление

Используем модель нейросети на C++

Камера, нейронки и дымящийся микро-ПК: дешевая и практичная альтернатива радару

Обучите YOLO NAS пользовательскому набору данных

Как ускорить Python с помощью C-расширений. Часть 1

FaceNet: Универсальный эмбеддинг для распознавания и кластеризации лиц

ТАУ для самых маленьких: пример реализации ПИД-регулятора в Unity3D

Вместо введения

Членимая калейдоскопическая сложность. Об устройстве и потенциале фасеточного глаза

Вход в Aeronet, эпизод 2: Самонаводящийся дрон

Вход в Aeronet, эпизод 4: Отыскать и бабахнуть

3500 в час с ChatGPT

HaGRID — огромный открытый датасет для распознавания жестов

Расчет транспортного потока на основе YOLOv5 и DeepSORT на базе Deepstream

Разметка именованных сущностей в Label Studio

Как быстро создать обучающий датасет для задач обнаружения объектов YOLO с помощью Label Studio

Информация