Обновить
5
Михаил Шустер@mmshaa9

Пользователь

8
Подписчики
Отправить сообщение

Поведение вместо плотности: динамический взгляд на кластеризацию

Время на прочтение9 мин
Охват и читатели3.4K

Несмотря на использование биологических аналогий, предлагаемый метод не относится к quorum sensing clustering в классическом смысле.
В работах, вдохновлённых quorum sensing, сигнал напрямую связан с локальной плотностью и используется как механизм адаптивного выбора радиуса влияния или порога плотности. Фактически такие методы остаются плотностными моделями кластеризации с биологической мотивацией (см., например, arXiv:1303.3934).

В предлагаемом подходе сигнал имеет иную природу.
Он не отражает количество соседей и не служит индикатором принадлежности к кластеру, а представляет собой внутреннее бинарное состояние агента, определяющее режим его локального взаимодействия с окружением.

Кластеризация в этой модели не является результатом разбиения пространства по геометрическим признакам. Она возникает как побочный эффект динамики, в которой устойчивые коллективные режимы поведения формируются, стабилизируются и защищаются через локальные правила взаимодействия.

Читать далее

Автоэнкодер: как нейросеть учится понимать норму

Время на прочтение6 мин
Охват и читатели7.3K

Непосвящённому человеку кажется, что нейронная сеть может всё.
Средства массовой информации этот миф только подпитывают, а где-то в недрах Голливуда Джеймс Камерон шепчет:
«Я не режиссёр — я пророк».

В реальной же повседневной работе от нейронной сети мне нужна одна простая и приземлённая вещь — поиск аномалий в данных.
И вот с этим нейросети действительно справляются. Более того, для этого у них есть специальный инструмент — автоэнкодер.

В этом небольшом опусе я попробую быстро, просто и без магии объяснить, что такое автоэнкодер, как он работает и почему он вообще способен находить аномалии.

Читать далее

Азарт против алгоритма: почему онлайн-казино не играет в кости со вселенной

Время на прочтение5 мин
Охват и читатели13K

С азартными играми люди начинают сталкиваться с самого раннего детства. Мы кидаем монету, чтобы выяснить, кто прав, тянем жребий, чтобы определить, кто будет в той или иной команде. Такие действия подчеркивают элемент случайности в наших решениях. В процессе взросления появляется желание что-то получить от выигрыша: дать щелбан своему противнику или получить от него деньги.

Читать далее

Снятие проклятия размерности: как познакомиться со своими данными

Время на прочтение6 мин
Охват и читатели7.2K

1. Проклятие размерности

Человек эволюционировал в 3 пространственных измерениях, и в них мы себя шикарно чувствуем. В них мы живем, радуемся, грустим, да и все драмы жизни проходят в этих измерениях. Правда в первой половине 20 века Теодор Калуца и Оскар Клейн нашли еще одно измерение, но оно маленькое и его людям не видно. После струнные теоретики, такие как Леонард Сасскинд, Герард т`Хофт, Яу Шинтун, Александр Виленкин  и другие, опять сильно усложнили картину мира, и к 4 пространственным измерениям добавили еще 6 (это минимум), но они все где то не пойми где, и влияют на жизнь только физиков-теоретиков, а остальным n-миллиардам людей на Земле, нет никакого дела до этих измерений, им и в 3 хорошо живется.

Другое дело математика и наука о данных, тут измерений может быть сколько угодно, например вот:

Читать далее

Вирус культуры: мемы и их влияние на небольшие коллективы

Время на прочтение7 мин
Охват и читатели8.2K

Слово мемы вошло плотно в обиход наверное всего человечества, ну по крайней мере того, которое регулярно пользуется интернетом. При слове мем в голову приход фразы типа “база”, “кандибобер” (я старый, так что помню еще это), “нельзя так просто взять…” и тому подобное. Этих фраз и картинок бесчисленное количество, и они по сути являются сигналом распознавания и декодирования ситуации, перевода ее в более простую плоскость, которую можно объяснить парой фраз или картинкой. Но вот в чем вся соль, сами мемы в истории человечества были всегда, возможно даже раньше, чем это человечество научало говорить, а вот слово в обиход ввел великий (по моей личной шкале величия) биолого-эволюционист Ричард Докинз. В своей книге “Эгоистичный ген”, вышедшей в 1976 году, автор ввел это слово в употребление. И конечно автор не имел ввиду картинку с котиком или видео со странными людьми, когда решил подарить миру это слово.

Читать далее

Личный топ методов Pandas

Время на прочтение2 мин
Охват и читатели19K

Pandas — это изумительная библиотека на Python для анализа и обработки данных. Она настолько хороша, что проще сказать, чего она не умеет, чем перечислить все её возможности. В мире аналитики это настоящий швейцарский нож.

В этой статье я хочу поделиться личным топом методов, которые помогают в первичной обработке больших данных.

Читать далее

Когда машинное обучение не нужно: статистика для бизнеса

Время на прочтение6 мин
Охват и читатели11K

«Есть ложь, наглая ложь и статистика» — этот афоризм, по утверждению Марка Твена, принадлежит премьер‑министру Великобритании Бенджамину Дизраэли. А по мнению скептиков — самому Твену. Как бы там ни было, статистика не так уж и врёт, по крайней мере не больше, чем машинное обучение (ML). Более того — в некоторых случаях она может оказаться привлекательнее, надёжнее и значительно дешевле, чем обучение и внедрение ML‑моделей.

В этой статье я пропущу очевидные вещи вроде среднего, медианы и моды и сразу перейду к более интересным и полезным инструментам. Примеры и код — на Python, с использованием библиотек numpy, pandas.

Читать далее

Информация

В рейтинге
Не участвует
Откуда
Хайфа, Израиль
Зарегистрирован
Активность

Специализация

Аналитик по данным, Ученый по данным