Статьи / Профиль mmshaa9 / Хабр

Михаил Шустер@mmshaa9

Пользователь

Подписчики

ПрофильСтатьи7ПостыНовостиКомментарии13

mmshaa9 26 янв в 07:28

Поведение вместо плотности: динамический взгляд на кластеризацию

9 мин

3.4K

Data Mining *

Мнение

Несмотря на использование биологических аналогий, предлагаемый метод не относится к quorum sensing clustering в классическом смысле.
В работах, вдохновлённых quorum sensing, сигнал напрямую связан с локальной плотностью и используется как механизм адаптивного выбора радиуса влияния или порога плотности. Фактически такие методы остаются плотностными моделями кластеризации с биологической мотивацией (см., например, arXiv:1303.3934).

В предлагаемом подходе сигнал имеет иную природу.
Он не отражает количество соседей и не служит индикатором принадлежности к кластеру, а представляет собой внутреннее бинарное состояние агента, определяющее режим его локального взаимодействия с окружением.

Кластеризация в этой модели не является результатом разбиения пространства по геометрическим признакам. Она возникает как побочный эффект динамики, в которой устойчивые коллективные режимы поведения формируются, стабилизируются и защищаются через локальные правила взаимодействия.

mmshaa9 14 дек 2025 в 09:00

Автоэнкодер: как нейросеть учится понимать норму

6 мин

7.3K

Python * Data Mining *

Непосвящённому человеку кажется, что нейронная сеть может всё.
Средства массовой информации этот миф только подпитывают, а где-то в недрах Голливуда Джеймс Камерон шепчет:
«Я не режиссёр — я пророк».

В реальной же повседневной работе от нейронной сети мне нужна одна простая и приземлённая вещь — поиск аномалий в данных.
И вот с этим нейросети действительно справляются. Более того, для этого у них есть специальный инструмент — автоэнкодер.

В этом небольшом опусе я попробую быстро, просто и без магии объяснить, что такое автоэнкодер, как он работает и почему он вообще способен находить аномалии.

mmshaa9 27 окт 2025 в 11:28

Азарт против алгоритма: почему онлайн-казино не играет в кости со вселенной

5 мин

13K

Научно-популярноеМатематика *

С азартными играми люди начинают сталкиваться с самого раннего детства. Мы кидаем монету, чтобы выяснить, кто прав, тянем жребий, чтобы определить, кто будет в той или иной команде. Такие действия подчеркивают элемент случайности в наших решениях. В процессе взросления появляется желание что-то получить от выигрыша: дать щелбан своему противнику или получить от него деньги.

mmshaa9 16 сен 2025 в 05:00

Снятие проклятия размерности: как познакомиться со своими данными

6 мин

7.2K

Python * Data Mining *

1. Проклятие размерности

Человек эволюционировал в 3 пространственных измерениях, и в них мы себя шикарно чувствуем. В них мы живем, радуемся, грустим, да и все драмы жизни проходят в этих измерениях. Правда в первой половине 20 века Теодор Калуца и Оскар Клейн нашли еще одно измерение, но оно маленькое и его людям не видно. После струнные теоретики, такие как Леонард Сасскинд, Герард т`Хофт, Яу Шинтун, Александр Виленкин и другие, опять сильно усложнили картину мира, и к 4 пространственным измерениям добавили еще 6 (это минимум), но они все где то не пойми где, и влияют на жизнь только физиков-теоретиков, а остальным n-миллиардам людей на Земле, нет никакого дела до этих измерений, им и в 3 хорошо живется.

Другое дело математика и наука о данных, тут измерений может быть сколько угодно, например вот:

+11

mmshaa9 25 авг 2025 в 03:56

Вирус культуры: мемы и их влияние на небольшие коллективы

7 мин

8.2K

Научно-популярное

Слово мемы вошло плотно в обиход наверное всего человечества, ну по крайней мере того, которое регулярно пользуется интернетом. При слове мем в голову приход фразы типа “база”, “кандибобер” (я старый, так что помню еще это), “нельзя так просто взять…” и тому подобное. Этих фраз и картинок бесчисленное количество, и они по сути являются сигналом распознавания и декодирования ситуации, перевода ее в более простую плоскость, которую можно объяснить парой фраз или картинкой. Но вот в чем вся соль, сами мемы в истории человечества были всегда, возможно даже раньше, чем это человечество научало говорить, а вот слово в обиход ввел великий (по моей личной шкале величия) биолого-эволюционист Ричард Докинз. В своей книге “Эгоистичный ген”, вышедшей в 1976 году, автор ввел это слово в употребление. И конечно автор не имел ввиду картинку с котиком или видео со странными людьми, когда решил подарить миру это слово.

mmshaa9 23 авг 2025 в 10:46

Личный топ методов Pandas

2 мин

19K

Data Engineering * Big Data * Python *

Pandas — это изумительная библиотека на Python для анализа и обработки данных. Она настолько хороша, что проще сказать, чего она не умеет, чем перечислить все её возможности. В мире аналитики это настоящий швейцарский нож.

В этой статье я хочу поделиться личным топом методов, которые помогают в первичной обработке больших данных.

mmshaa9 20 авг 2025 в 14:16

Когда машинное обучение не нужно: статистика для бизнеса

6 мин

11K

Статистика в IT

Из песочницы

«Есть ложь, наглая ложь и статистика» — этот афоризм, по утверждению Марка Твена, принадлежит премьер‑министру Великобритании Бенджамину Дизраэли. А по мнению скептиков — самому Твену. Как бы там ни было, статистика не так уж и врёт, по крайней мере не больше, чем машинное обучение (ML). Более того — в некоторых случаях она может оказаться привлекательнее, надёжнее и значительно дешевле, чем обучение и внедрение ML‑моделей.

В этой статье я пропущу очевидные вещи вроде среднего, медианы и моды и сразу перейду к более интересным и полезным инструментам. Примеры и код — на Python, с использованием библиотек numpy, pandas.

+16

Поведение вместо плотности: динамический взгляд на кластеризацию

Автоэнкодер: как нейросеть учится понимать норму

Азарт против алгоритма: почему онлайн-казино не играет в кости со вселенной

Снятие проклятия размерности: как познакомиться со своими данными

Вирус культуры: мемы и их влияние на небольшие коллективы

Личный топ методов Pandas

Когда машинное обучение не нужно: статистика для бизнеса

Информация

Специализация