Comments / Profile of rnj2000 / Habr

Константин@rnj2000

ML Engineer

Subscribers

Простыми словами о методе максимального правдоподобия и информации Фишера

rnj2000 Aug 1 2025 at 14:07

Не в обиду автору, но вдруг те, кто когда-то в университете всё это проходил и просто решил освежить в голове по каким-то причинам, оказались тут.
Канал на "Душкин объяснит", там всё крайне проще и понятнее. Два видео про функцию правдоподобия и максимальное правдоподобие, на скорости x1.5.
Хватит 15 минут, чтобы все понять. Если захочется поболее вникнуть в тонкости, вернетесь сюда)

Тестирование ML-систем

rnj2000 Aug 5 2022 at 07:39

Это конечно все здорово, но медицинская разметка - это долго и дорого.
Сабсеты кажется хорошей идеей, но сколько надо насобирать данных, чтобы получить адекватные доверительные интервалы метрик на этих сабсетах.
Про тесты на лик: к сожалению единого идентификатора пациента в России, как и в остальном мире нет. И элементарно одного и того же человека очень сложно отловить, чтобы исключить такой лик.
Out-of-Distribution - это просто беда. Я видел маммографию с оцифровщика, под снимком лежала сим-карта. И пользователи не хотят понимать, что этого объекта быть не должно и почему сим-карта воспринимается как образование. Его вывод - ваша система отстой.

Как улучшить распознавание скелетов в MediaPipe

rnj2000 May 10 2022 at 14:19

Тут же предлагается bounding box для первичной детекции руки разметить, без самих ключевых точек. Это делается максимально быстро в простом VGG Image Annotator или грузится на толоку.

За статью респект, применю ваш в опыт в поиске ключевых точек на рентгенах костей

Распознавание номеров. Как мы получили 97% точности для Украинских номеров. Часть 2

rnj2000 Dec 7 2020 at 12:05

Из личного опыта MRCNN показывает результаты хуже результаты с другими оптимизаторами. Если классы сбаласированы то Adam справляется на ура. SGD и RMSprop спасают, если какие-то буквы встречаться будут откровенно редко (1к10 и больше). Но опять же с этим можно побороться, если прикрутить взвешенную функцию потерь.

Модель для распознавания степени поражения лёгких на КТ: мы резко увеличили точность сортировки больных

rnj2000 Dec 3 2020 at 16:38

В таких вещах датасет может быть ценнее модели)

Модель для распознавания степени поражения лёгких на КТ: мы резко увеличили точность сортировки больных

rnj2000 Dec 3 2020 at 16:36

16 бит в png влезает спокойно, при желании можно даже несколько каналов

Модель для распознавания степени поражения лёгких на КТ: мы резко увеличили точность сортировки больных

rnj2000 Dec 3 2020 at 09:27

Вы конечно молодцы и задача классная. Но только в общих словах описали pipeline для работы и покидались красивыми словами. Где же хоть какие-то метрики? Какого IoU или Dice добились с Unet? Какова AUC ROC при классификации по категориям?

Что покупать для глубокого обучения: личный опыт и советы использования GPU

rnj2000 Sep 28 2020 at 13:47

Хорошая статья. Тоже хотел перевести, но меня опередели)

Стагнация машинного обучения. Многие задачи не будут решены никогда?

rnj2000 Sep 8 2020 at 06:24

Так где-то была статья, что тренд в разработке новых моделей изменился. Раньше гнались за размером и новыми рекордами метрик. Теперь гонятся за эффективностью без падения метрик.

5 алгоритмов регрессии в машинном обучении, о которых вам следует знать

rnj2000 Sep 1 2020 at 07:47

Кстати по мне, так нейросетевая регрессия — надстройка над линейной. Так в пределах получения выхода одного нейрона без активации, что мы имеем? <x, w> — скалярное произведение входов на веса. В нейронке туча регрессий, на выходы которых наложена нелинейность активационных функций.

Multi-Target в Albumentations

rnj2000 Aug 12 2020 at 06:57

За lambda спасибо. Про неё не знал.

Multi-Target в Albumentations

rnj2000 Aug 11 2020 at 16:36

еще забыл, что частенько функции(например InvertImg) работают с 8-битными изображениями. А в медицине, например бывает 12-16 бит. Поэтому вставляешь костыли: конвертируешь сначала до float 0.-255., применяешь аугментацию, а потом до 0.-1.

Multi-Target в Albumentations

rnj2000 Aug 11 2020 at 14:37

albumentations конечно хорош, но инфы по нему не так много. Особенно когда он начнет засыпать ошибками.

MASK-RCNN для поиска крыш по снимкам с беспилотников

rnj2000 May 12 2020 at 12:58

Я бы еще посоветовал вам при обучении модели попробовать Tversky loss-функцию — это надстройка над Dice ошибкой, только с доп. параметром По факту заставляет сеть штрафовать больше за False Positive или False Negative.
Крыш все-таки гораздо меньше фона и классы сегментации несбалансированы.

Адаптивные антенные решётки: как это работает? (Основы)

rnj2000 Mar 10 2020 at 11:47

Однако в условиях когерентности вообще не раскрыты индексы t_k, t_m. Там какая-то путаница.

Адаптивные антенные решётки: как это работает? (Основы)

rnj2000 Mar 10 2020 at 09:51

Автор, спасибо за статью. Сам инженер в области антенной техники. Подход с точки зрения векторов однозначно топ.

Геометрия машинного обучения. Разделяющие гиперплоскости или в чём геометрический смысл линейной комбинации?

rnj2000 Feb 12 2020 at 12:37

Да вполне, спасибо большое.
Еще не понятен один момент. При определении расстояния от точки до плоскости dist(x) в знаменателе норма вектора w. А зачем она там? модуль скалярного произведения |w^Tx+b| разве не дает нам расстояние? В коде например так и сделано.

rnj2000 Feb 5 2020 at 15:10

Щас будет глупый вопрос, но почему мы забили на знаки в функциях linei_w1(w1), когда делили?

Обучение и оценка модели с Keras

rnj2000 Feb 5 2020 at 06:35

Отличная статья. Но много, за раз не осилил. Пришлось возвращаться 3 раза.
А чем вызвана любовь к Keras? Для себя решил, что Keras скорее хороший старт, чем полноценный инструмент. В связи с этим копаюсь и переношу часть проектов в PyTorch.

В чем разница между 4G и 5G?

rnj2000 Oct 3 2019 at 07:32

Давайте не преувеличивать.
5G приципиально другой стандарт? Не согласен.
Почему?
1) Большие скорости обеспечивает. Ну к сожалению пути только два, повышать мощность (т.е. отношение С/ш), либо полосу. Клод Шеннон нам в помощь с его предельной теоремой. 5G предлагают Использовать новый частотный диапазон 26.5 ГГц. Потому что там можно гонять полосу сигнала 100 и более МГц. В 5ГГц и ниже это сделать сложнее.
2) Направленные решетки (Massive MIMO) — опять то же самое, но тут мы поднимаем мощность на приёмнике, т.е. с/ш. + Всякие плюшки с точки зрения ЭМС и т.д. Надо понимать, что активные решетки — это дорого.
3) Интернет вещей. В данным момент у нас есть несколько нелицензируемых диапазонов, таких как 433 МГц, 868 МГц, 2.4 и 5 ГГц. И куча протоколов по которым работают «умные» устройства типа ZigBee и прочие. Хотят засунуть все это в концепцию 5G, чтобы был единый протокол и универсальный радиомодуль, которым мог бы общаться со всеми сразу.
4) Новые кодовые конструкции. Да там вместо турбокодов предлагают использовать LDPC. Это простой блоковый код. Он не оптимален в отличии от турбокодов. В чем преимущество? У него простая порождающая и проверочная матрицы. Скорость кодирования и декодирования возрастет. Однако работает он при хороших С/ш. Я вангую, что будет использоваться в диапазоне 26.5 ГГц.
5) Новые сетевые плюшки типа работы на две базовые станции на их границе, mesh сети и т.д. Тут ничего не скажу, да это все круто, но в сетевых вещах и не разбираюсь.
Мое мнение: 5G в первую очередь хочет объединить всё и вся. Создать единый стандарт общения между устройствами, универсальный радиомодуль. Помимо этого хочется больших скоростей, потому что объемы данных растут и достаточно быстро. Условные беспилотные авто пересылают тучу информации. Способы поднять скорость используются очевидные и прям новшеств там нет.

2 3