Articles / Bookmarks / Profile of Analytique / Habr

How to become an author

Ольга Плюта @Analytique

Product data analyst | Ex-Yandex

Profile Publications 1Comments 9Bookmarks 124

Vanovsky714 Jan 24 at 19:23

Сколько еще протянут мануфактуры?

Easy

5 min

7K

Programming*Machine learning*Artificial Intelligence

Opinion

Сотрудник надомной мануфактуры мисье Жибер доходчиво объясняет, в каком положении он оказался, когда увидел сколько ткани выпускает недавно построенная неподалеку фабрика

Читать далее

-4

simneo Jan 23 at 14:15

Как мы защищаем абонентов от телефонных мошенников и спама

Easy

6 min

3.5K

Spamming and anti-spammingInformation Security*Т-Банк corporate blog

Всем привет! Я Александр Фадеев, руководитель проектов по безопасности мобильного оператора «Тинькофф Мобайл». Наверняка вы периодически получаете звонки от мошенников, которые прикидываются специалистами банка. Или надоедливые звонки и СМС с предложениями сменить интернет-провайдера, стать клиентом стоматологии или купить квартиру. Телефонные операторы постоянно ищут способы защитить абонентов от злоумышленников, которые пытаются украсть деньги, и спамеров, и сегодня я расскажу, как это делаем мы.

Это вторая статья из цикла об инструментах для защиты клиентов Тинькофф от злоумышленников. О том, какие это инструменты, вы можете узнать из вводной статьи.

Читать далее

+7

Squirrelfm Jan 22 at 08:30

Теория игр за 15 минут

Easy

15 min

61K

Mathematics*Popular scienceLogic gamesRaft corporate blog

Tutorial

Многие из вас, я уверен, слышали о теории игр в какой-то момент своей жизни. Если вы хотите выглядеть умным и произвести впечатление на свою девушку — просто упомяните «игру с нулевой суммой» или «эволюционную стратегию», и ваши шансы отвести её домой сегодня вечером только что подскочили на 50%. Или вы можете использовать теорию игр, чтобы принимать решения в инвестировании своих денег (чтобы их полностью потерять и разориться) или, например решая, на какой девушке жениться (что также очень вероятно вас разорит). Как видите, это очень полезная теория.

Чтобы казаться умным - достаточно выучить эти пару выражений, но чтобы на самом деле что-то понимать - придется разобраться. Оказывается, это не так уж сложно и довольно интересно. Давайте посмотрим.

Читать далее

+103

Morlena106 Jan 22 at 11:30

Учимся создавать простых ботов или туториал по библиотеке TeleBot

Easy

9 min

45K

Python*Programming*API*Studying in IT

Начнем с того, что библиотек для разработки телегам-ботов на Python несколько, я упомяну основные три. В первой части статьи будет небольшой обзор этих библиотек (примеры кода тут будут для красоты, не пугайтесь, ниже будет пошаговый Гайд по одной конкретной библиотеке), потом комментарий о том, какую стоит выбрать для разработки конкретно своего бота и подробное руководство для новичков по разработке бота с разбором каждой строчки кода.

Бегу изучать ботов

+5

Magnit_tech Jan 20 at 08:55

Путь исследователя цифровых продуктов в «Магните»: проблемы и решения

8 min

1.9K

Product Management*Magnit Tech corporate blog

«Магнит» — это не только продукты съедобные, но и продукты цифровые: мобильные приложения, веб-сервисы. Команда пользовательского опыта старается делать их лучше: для этого есть исследователи, которые проводят исследования внутренних (для сотрудников) и внешних (для клиентов) продуктов, и CJE — эксперты по клиентскому опыту, которые строят карты клиентских путей на основе данных исследований и обратной связи.

Наша работа — находить и помогать решать проблемы пользователей. Но мы сами, в свою очередь, сталкиваемся с проблемами при выполнении этой задачи. Об этих проблемах и о том, как мы их решаем, расскажем в статье.

Читать далее

+9

lingbizkit Jan 19 at 17:05

Как мы победили в двух хакатонах Цифрового Прорыва. История вторая

Easy

5 min

1.1K

HackathonMachine learning*

Retrospective

Всем привет! Это продолжение рассказа о том, как наша команда Ling Bizkit победила в двух хакатонах. В первый раз это было соревнование Северо-Западного региона в рамках Цифрового Прорыва, а во второй — уже всероссийский этап.

Читать далее

+2

maratyv Jan 17 at 19:23

Типичные задачи аналитика данных. Часть 1. Упала метрика

Medium

15 min

15K

Python*Data Mining*Statistics in IT

Tutorial

В прошлой статье мы рассматривали неочевидные проблемы АБ тестирования и как можно с ними справляться [ссылка]. Но часто бывает так, что при внедрении новой функциональности АБ тестирование провести нельзя. Например, это типично для маркетинговых кампаний нацеленных на массовую аудиторию. В данной ситуации существует вероятность того, что пользователи контрольной группы, которым недоступна рекламируемая функциональность, начнут массово перерегистрироваться. Также возможен сценарий, при котором возникнет значительное количество негативных отзывов из-за воспринимаемой дискриминации. Но задача оценки таких нововведений одна из наиболее частых, которые приходится решать аналитикам. Если метрики только улучшаются, то это обычно легко объяснить хорошей работой, а если метрика ухудшилась, то сразу появляется задача на аналитика. В этой заметке мы рассмотрим первую часть задачи - а действительно ли метрика упала и если да, то имеет ли смысл разбираться дальше?

Читать далее

+5

aleksejs1 Jan 18 at 08:13

Как содержать пароли. Мой сетап

Medium

7 min

55K

Information Security*Cryptography*Data storage*Cloud services*Lifehacks for geeks

Case

Я долго собирал информацию о том, как организовать свои аккаунты. Как сделать доступ к ним достаточно надёжным и стойким к утере девайсов.

Меня интересовало, как я могу залогиниться туда, где многофакторная авторизация через телефон, в случае потери телефона.

Или, как обезопасить себя от забывания мастер пароля от менеджера паролей? На моей практике я несколько раз забывал пин-код от банковской карты, состоящий из 4-ёх цифр, после ежедневного использования на протяжении многих месяцев. Мозг - странная штука.

В итоге, спустя месяцы изучения темы, я пришёл к следующему сетапу, который решил описать в виде мануала.

Читать далее

+69

NewTechAudit Jan 18 at 08:56

Простое внедрение аннотаций статистической значимости

Easy

6 min

2.2K

Python*Data visualization*

Tutorial

Привет, Хабр!

Сегодня с вами участница профессионального сообщества NTA Яруллина Ляйсян.

В современном мире визуализация данных используется повсеместно. Она позволяет в сжатые сроки предоставить изображение или видео, описывающее колоссальное количество информации, что делает визуализацию незаменимой в анализе данных.

Но не менее важной в указанном вопросе является статистика. Она позволяет провести качественную обработку данных и сделать выводы на ее основе — без статистической базы графическое представление данных не несет особой ценности. И в наше время океана неподтвержденной информации это куда более серьезная проблема, чем могло бы показаться изначально. Поэтому важно уметь быстро внедрять аннотации статистической значимости в полученную визуализацию и уметь ее расшифровывать.

В последние годы создаются специальные статистические пакеты, которые позволяют реализовать вышеизложенное в жизнь быстро и просто. Например, специально для библиотеки Seaborn, используемой для построения статистических графиков, был создан пакет Statannotations. Он позволяет проводить дополнительные вычисления статистических тестов и добавлять их результаты в виде аннотаций к графикам. Рассмотрю его подробнее и для примера загляну в глубины мозга.

Узнать больше

+6

Antipozitive Jan 18 at 11:31

Исследуем Скрытые Сокровища: Малоизвестные Библиотеки Python для Аналитики Данных

Easy

3 min

8.7K

Python*Big Data*Machine learning*

Review

Введение: Привет, Хабр! Сегодня мы исследуем мир менее известных, но чрезвычайно полезных библиотек Python, которые могут значительно обогатить ваш аналитический инструментарий.

? Подписывайтесь на мой телеграмм-канал DataTechCommunity для получения ежедневных обновлений о Python и аналитике данных!

Содержание:

Рассматриваем 5 малоизвестных, но полезных библиотек для аналитиков данных. Они помогут вам в машинном обучении, обработке больших данных и визуализации.

Читать далее

+6

Hidanio Jan 17 at 14:47

Коротко про алгоритмы и структуры данных

Easy

3 min

25K

Programming*VK corporate blogAlgorithms*

Opinion

Привет, Хабр! Меня зовут Ричард, я работаю в команде kPHP в VK, занимаюсь разработкой kPHP, плагинов для IDE, а также другого инструментария, делая жизнь разработчиков проще. В своей работе мне приходится иметь дело с PSI деревьями, AST, самописными структурами данных и их модификациями, и даже QuickSelect (и более сложные алгоритмы) мне доводилось реализовывать. Хочу немного поговорить про один из краеугольных, пожалуй, камней в IT, а именно про «алгоритмы и структуры данных» — тема не теряет актуальности со времен появления Хабра. Заранее оговорюсь, мой пост на 90% состоит из личного опыта во время обучения, работы и преподавания.

Читать далее

+22

nvv Jan 15 at 16:30

Организация SQL скриптов крупного проекта

Medium

7 min

11K

PostgreSQL*SQL*Designing and refactoring*Database Administration*OTUS corporate blog

Tutorial

Если проект использует реляционную СУБД обязательно возникнет вопрос - как организовать скрипты для сохранения гибкости и уменьшения трудозатрат.

Погружаемся

+14

tagir_analyzes Jan 15 at 17:14

Визуализация статистики о том, что и так все знают

Easy

7 min

15K

Data Mining*Big Data*Альфа-Банк corporate blogData visualization*Mobile App Analytics*

Analytics

✏️ Technotext 2023

Привет, Хабр! Меня зовут Тагир, я занимаюсь аналитикой игровых механик. Недавно я наткнулся на статью, в которой визуализировали жизни тысяч людей с точностью до минуты — люди отмечали, на что они тратят свое время в течение дня, а автор агрегрировал эти данные и сделал визуализацию, разбив активности по категориям.

Я переложил эту логику на банковские транзакции, чтобы посмотреть, на что люди тратят свои деньги в определенный момент времени, и получил статистику, о которой все и так вроде бы знают. На обед люди ходят в ближайшее кафе и заправляют машину, после работы — в супермаркет, а на выходных — отдыхают в увеселительных заведениях. Но визуализировав эти данные, увидел, что выглядит это весьма залипательно.

Читать далее

+28

it_alex_br Jan 16 at 10:01

Удаленка для банковских сотрудников: как сохранить данные в безопасности и перевести сотрудников в онлайн

Easy

14 min

6.5K

IT Infrastructure*ГК ЛАНИТ corporate blogFinance in ITIT-companies

Во время пандемии в 2020 году весь мир столкнулся с необходимостью обеспечить своих сотрудников возможностью работать из дома, да и вообще из любой точки мира. Банковская сфера, как и другие секторы, работающие с чувствительными данными, столкнулись с трудностями адаптации своих ИТ-систем и рабочих данных к удаленному формату. Нужно учесть и уровень защиты данных, и внедрять новые технические решения, и оптимизировать рабочие процессы.

В этой статье хочу разобрать кейс об организации системы удаленной работы сотрудников в банковском секторе, который мы с коллегами из «ЛАНИТ-Интеграции» внедрили в крупном российском банке.

Читать далее

+63

rikki_tikki Jan 16 at 11:09

Ежедневные скрам-стендапы — пустая трата времени

3 min

20K

Development Management*OTUS corporate blog

Translation

Один из членов команды сказал мне, что стендапы — это пустая трата времени. И я с этим согласен. А вы разве не согласны?

Читать далее

+10

Shamil3310 Jan 16 at 13:33

Статистика на примерах с Python #1

Medium

5 min

15K

Python*Mathematics*Data visualization*Machine learning*Popular science

1.1 Общая информация

1.2 Генеральная совокупность и выборка

1.3 Типы переменных. Количественные и номинативные переменные

1.4 Меры центральной тенденции

Читать далее

+10

antipov_dmitry Jan 14 at 10:25

Уродливая математика в машинном обучении или чему нам стоит поучиться у деривативов?

Easy

7 min

13K

System Analysis and Design*Big Data*Machine learning*Artificial IntelligenceData Engineering*

Opinion

Когда слушаешь доклады на больших ML-конференциях, то часть докладов вызывает восторг, но другая часть на послевкусии вызывает странное чувство. Да, доклад может быть очень крутым, математика блестящей, сложность крышесносной, но что-то как будто бы не так.

Эта статья — развлекательно-философская, все совпадения с реальностью — случайны, персонажи вымышлены, с точкой зрения — можно не соглашаться, но поразмышлять — стоит.

Да при чем здесь вообще деривативы? А просто у деривативов, дженги и машинного обучения — много общего, давайте разбираться.

Читать далее

+6

Nestor_Siherti Jan 15 at 09:10

Социальный проект: визуализация данных медицинской статистики

Easy

8 min

5.8K

System Analysis and Design*IT careerPopular scienceHealthЯндекс Практикум corporate blog

Case

✏️ Technotext 2023

Хабровчане, приветствую! Меня зовут Андрей Иванов, я системный аналитик в сфере медицины и здравоохранения. До 2005 года работал практикующим врачом, потом руководил медицинским информационно-аналитическим центром. Спустя время возникла настоятельная потребность получить базовое IT-образование и научиться тому, чем прежде приходилось руководить, — так я начал обучение на курсе «Системный аналитик».

Позже я принял участие в Мастерской Практикума, где смог реализовать давнюю идею — сделать удобочитаемыми материалы медицинской статистики. Выбор пал на отчёт главного онколога Министерства здравоохранения России. Он выходит ежегодно и выглядит как огромный сборник таблиц формата А4. Ни один даже самый крутой мегамозг, просматривая эти гектары цифр, не в состоянии понять, «что такое хорошо и что такое плохо в онкологической службе».

Решить эту проблему и взялась команда аналитиков данных. Сразу же оговорюсь, мы не пытаемся анализировать данные онкологической статистики. Мы разрабатываем целевой инструмент, который хотим передать в руки медицинского (онкологического) сообщества — там уже смогут с полным правом делать профессиональные выводы «о добре и зле» и конечно же, ответить на извечный вопрос «что делать?».

Читать далее

+11

neoflex Jan 15 at 12:02

Особенности партиционирования в PostgreSQL и Apache Hive

11 min

8K

PostgreSQL*SQL*Neoflex corporate blog

Tutorial

Часто специалисты, работающие с классическими реляционными базами данных, например, с PostgreSQL, испытывают затруднения в работе при переходе на систему хранения больших данных типа Apache Hive. Это связано с непониманием того, как можно использовать в новой среде уже наработанные подходы и методы работы с данными.

В данной статье рассмотрены некоторые особенности использования языка SQL в реляционных СУБД и Apache Hive. Кроме того, проведен сравнительный обзор возможностей и подходов, а также применение партиционирования на практике.

Материал будет полезен специалистам младших и средних грейдов, которые используют в своей практике SQL, но имеют мало опыта в Hive или Postgres.

Читать далее

+2

mr-pickles Jan 15 at 13:10

Аннотирование args и kwargs в Python

Easy

4 min

11K

Python*Programming*Wunder Fund corporate blog

Translation

Когда я пытаюсь обойтись без *args и **kwargs в сигнатурах функций, это не всегда можно сделать, не вредя удобству использования API. Особенно — когда надо писать функции, которые обращаются к вспомогательным функциям с одинаковыми сигнатурами.

Типизация *args и **kwargs всегда меня расстраивала, так как их нельзя было заблаговременно снабдить точными аннотациями. Например, если и позиционные, и именованные аргументы функции могут содержать лишь значения одинаковых типов, можно было поступить так:

def foo(*args: int, **kwargs: bool) -> None: ...

Применение такой конструкции указывает на то, что args — это кортеж, все элементы которого являются целыми числами, а kwargs — это словарь, ключи которого являются строками, а значения имеют логический тип.

Но нельзя было адекватно аннотировать *args и **kwargs в ситуации, когда значения, которые можно передавать в качестве позиционных и именованных аргументов, могут, в разных обстоятельствах, относиться к различным типам. В таких случаях приходилось прибегать к Any, что противоречило цели типизации аргументов функции.

Читать далее

+18

3