Обновить
39.09

Статистика в IT

Статистика, исследования, тенденции

Сначала показывать
Период
Уровень сложности

Методы анализа A/B тестов: как выбрать правильный метод для каждого типа метрик и размера выборки

Уровень сложностиСредний
Время на прочтение10 мин
Охват и читатели39K

Все, кто работает с аналитикой и продуктами, знают, что проведение А/Б тестирования — важный шаг для повышения эффективности бизнеса. Однако не всегда понятно, как проводить этот тест и какие статистические методы использовать. В этой статье я постараюсь помочь вам разобраться в этом вопросе. Вместо теоретических рассуждений будут практические советы, как выбирать метрики, как использовать различные статистические методы и примеры кода на Python, которые можно использовать сразу же. Эта статья станет незаменимой шпаргалкой для всех, кто планирует провести А/Б тест, и будет полезной как для новичков, так и для профессионалов.

Читать далее

Практический подход к изучению профиля клиентов по данным популяционного исследования. Counterfactual learning

Время на прочтение2 мин
Охват и читатели794

В данном тексте я хочу порассуждать и поделиться своими мыслями о проблеме исследования профиля клиентов на основе клиентского исследования. Данная тема является для меня новой, поэтому хотелось бы обсудить её с сообществом. Буду рад обсуждению в комментариях о плюсах и минусах предлагаемого мной подхода. В своем подходе я пытаюсь сделать поправку оценки характеристики представителей популяции по некоторой подвыборке. Представители популяции имеют разную вероятность попасть в подвыборку, что создает смешение выбора. Кроме смещения выбора, присутствует смещения ответа, так как попадание в выборку не гарантирует получения информации о представителе популяции. Данный текст является адаптацией моей публикации по теме на medium.

Читать далее

Пробить потолок: куда может расти специалист уровня сеньор

Время на прочтение6 мин
Охват и читатели10K

В среднем путь от джуниора до сеньора занимает около пяти лет. Сеньор уже работал в крупных коммерческих проектах, самостоятельно выбирает технологии для конкретной задачи, руководит командой либо консультирует коллег. Попытались разобраться, как развивать карьеру айтишникам, уже достигшим профессиональных высот.

Читать далее

20 фактов кибербеза

Время на прочтение4 мин
Охват и читатели6.8K

Delivery, «Яндекс.Еда», «Гемотест»: кто еще под колпаком?

«Никогда такого не было, и вот опять» — примерно так мы думаем, когда читаем новости об очередной утечке данных или хакерской атаке. Вы тоже заметили, как они участились в последнее время? Мы с коллегами решили собрать для вас 20 фактов о киберугрозах, на которые стоит обратить особое внимание. 

Время и деньги 

1. Общий ущерб от преступлений с использованием компьютерных технологий в 2021 году в России превысил 150 млрд рублей, подсчитали в RTM Group. Они опирались на возбужденные уголовные дела, связанные с использованием таких технологий.

2. К концу 2016 года каждые 40 секунд какая-то компания становилась жертвой программ-вымогателей. К 2021-му это время сократилось до 11 секунд, писал Cybercrime Magazine. По прогнозам Cybersecurity Ventures, к 2031 году таким атакам бизнес и конечные потребители будут подвергаться уже каждую пару секунд.

3. По оценкам представителя сервиса Data Leakage & Breach Intelligence, только с февраля нынешнего года в Сеть могли утечь данные 8 млн клиентов различных сервисов доставки еды. Самая крупная утечка были у компаний «Яндекс.Еда» (затронула 6,8 млн пользователей) и «Два берега» (780 тыс.). Однако здесь еще не был учтен недавний случай с Delivery Club: масштабы утечки могут стать рекордными на рынке. 

4. За прошлый год количество киберпреступлений выросло на 1,4% по сравнению с 2020-м, сообщало МВД России.

5. По данным крупнейшего в мире производителя аппаратного и программного обеспечения IBM, большинству компаний требуется 197 дней, чтобы обнаружить преступление, и до 69 дней, чтобы его локализовать.

Читать далее

Показатели работы биометрических алгоритмов

Время на прочтение10 мин
Охват и читатели6K

Наши статистические красавицы закончили наводить марафет и погрузились в сладостный, волшебный, поэтический мир сводок, цифр, отчетов, планов и смет.

(К/Ф "Служебный роман", режиссёр -- Э. Рязанов)

В предыдущей статье «Биометрия в платежах» я рассмотрел основные технологии, используемые для аутентификации и идентификации человека по лицу (face recognition). Я описал принципы работы алгоритмов нахождения лица на снимке, распознавания черт лица и создания биометрических шаблонов. В этой статье я остановлюсь подробнее на оценке качества работы решений по идентификации и аутентификации пользователя по лицу.

Погрузиться в чарующий мир

Битва за условное форматирование: дополняем стандартный функционал Power BI

Время на прочтение8 мин
Охват и читатели6.2K

Как использовать для визуализации такой замечательный инструмент, как условное форматирование, если ваши данные против этого? Как добавить в отчет красивую карту, если несколько точек "портят" всю картину? Как использовать статистические методы для настройки внешнего вида вашего отчета?

Я постарался рассказать об этом на примере выполнения задания для хакатона по Power BI.

Читать далее

Python, корреляция и регрессия: часть 3

Время на прочтение19 мин
Охват и читатели23K

Предыдущий пост см. здесь.

Прежде чем перейти к изучению нормального уравнения, давайте рассмотрим основы матричного и векторного умножения.

Читать далее

Python и статистический вывод: часть 3

Время на прочтение22 мин
Охват и читатели60K

Для статистиков и исследователей данных проверка статистической гипотезы представляет собой формальную процедуру. Стандартный подход к проверке статистической гипотезы подразумевает определение области исследования, принятие решения в отношении того, какие переменные необходимы для измерения предмета изучения, и затем выдвижение двух конкурирующих гипотез. Во избежание рассмотрения только тех данных, которые подтверждают наши субъективные оценки, исследователи четко констатируют свою гипотезу заранее. Затем, основываясь на данных, они применяют выборочные статистики с целью подтвердить либо отклонить эту гипотезу.

Читать далее

Python, исследование данных и выборы: часть 5

Время на прочтение11 мин
Охват и читатели7.4K

Заключительный пост №5 для начинающих посвящен сопоставительной визуализации электоральных данных.

Читать далее

Python, исследование данных и выборы: часть 2

Время на прочтение12 мин
Охват и читатели77K

Пост №2 для начинающих посвящен описательным статистикам, группированию данных и нормальному распределению. Все эти сведения заложат основу для дальнейшего анализа электоральных данных.

Читать далее

Обзор рынка труда QA/QC в Москве

Время на прочтение4 мин
Охват и читатели4.8K

Я всегда с интересом читаю обзоры рынка труда, которые публикуются на Хабре. Но, после них у меня всегда оставалось чувство легкого голода: нехватало более подробного анализа по моему сегменту рынка и региону. Да и с регулярностью все было не то чтобы хорошо. Так пару лет назад, у меня появилась идея сделать что-то вроде дашборда по рынку труда QA специалистов Москвы на основе данных HH.ru. Результаты мне показались достаточно интересными, чтобы принести их сюда.

Начну с того, чего в этом отчете нет. Не буду отбирать хлеб у авторов с "Хабр Карьера" – их опросы по зарплатам трудно превзойти по степени достоверности, – поэтому в моих отчетах нет цифр по заработной плате. Также нет точности в абсолютных цифрах. Причины в том, что атрибуция вакансий на HH.ru сделана своеобразно и одна вакансия может публиковаться несколько раз под разными ID. С другой стороны, одно объявление может соответствовать нескольким открытым позициям в компании. Поэтому рассматривать абсолютные цифры следует с осторожностью. Но проводить сравнительный анализ эти данные все же позволяют. Для сбора вакансий использовалась открытая часть API HH.ru, которая отдает описание вакансий в формате JSON. Часть графиков построена на базе параметров переданных в JSON-формате, часть - на основе анализа текстовых описаний вакансий. Наблюдение велось с марта 2019 по декабрь 2020 гг. в разделе "Тестирование" по г. Москве. Запрос был направлен на получение только специалистов по тестированию, вакансии с другой специализацией отбрасывались.

Посмотрим как менялся совокупный спрос в этом году на фоне прошлого:

Читать далее

Выбор мобильных устройств: пошаговая инструкция для начинающих QA. Часть II

Время на прочтение7 мин
Охват и читатели23K
Только за месяц этот вопрос был задан на трех митапах по тестированию, естественно в том формате ответ был очень общий. Информации совсем немного. Задача требует работы со статистикой, а это в основные обязанности тестировщика не входит. Я со статистикой работала плотно, есть что рассказать, чем поделиться и, что не менее важно, сейчас у меня есть время, а такая публикация требует его немало. Я ничего не продаю, я просто делюсь своими знаниями ).

Просьба к опытным QA mobile поделиться своим опытом в комментариях. Это не займет много времени. А новичкам это нужно.

В первой части мы заглянули в готовый список и прошли четыре первых шага: попытались получить свою статистику, проанализировали приложение и ЦА, подготовили шаблон требований/характеристик, изучив статистику производителей. И отдельно подумали нужен ли нам планшет(ы).

Во второй переходим к выбору конкретных моделей, попутно изучив лидеров и общие тенденции рынка.

Читать дальше →

Коронавирус и интернет

Время на прочтение4 мин
Охват и читатели4.5K
События, происходящие в мире из-за коронавируса, очень ярко подсвечивают проблемные зоны в обществе, экономике, технологиях.

Речь не о панике — она неизбежна и повторится при следующей глобальной проблеме, а о последствиях: больницы переполнены, магазины пусты, люди сидят по домам… моют руки,

image

и непрерывно “запасают” Интернет…, но и его, как оказалось, не хватает в тяжелые дни самоизоляции.

Что уже произошло?


Читать дальше →

Ближайшие события

Управление ликвидностью и автоматизация дебиторской, кредиторской задолженностей — важные инновации для малого бизнеса

Время на прочтение4 мин
Охват и читатели4.3K
image

Владелец компании собирает своих сотрудников и говорит: «Вы очень упорно поработали в этом году, и в результате прибыль компании существенно выросла. В качестве вознаграждения я выписываю каждому из вас чек на 5 тыс. долларов». Взволнованные от радости сотрудники начали поздравлять друг друга. И тут начальник добавляет: «И если вы покажете такое же рвение в следующем году, я подпишу эти чеки!»
— Автор неизвестен

Больше всего над этой ситуацией будут смеятся те, кто не понаслышке знаком с этой проблемой, то есть владельцы малого бизнеса. МБ — двигатель развития общества и экономики в любой стране. Государства, сформировавшие наиболее благоприятные для создания и ведения простейших бизнес-предприятий регуляторные среды, как правило, находятся на верхних строчках рейтингов процветающих стран. По данным Администрации малых предприятий США, экосистема МБ в стране — очень крупная отрасль. К этой категории относятся 99,7% всех бизнесов страны. Более половины (54%) всех продаж в США происходит в магазинах 28 млн субъектов МБ. Кроме того, малые бизнесы дают стране 55% всех рабочих мест и уже создали 66% новых рабочих мест с 1970-х годов. Более 600 тыс. открытых по франшизе малых предприятий генерируют 40% всех розничных продаж и предоставляют рабочие места для 8 млн человек.
Читать дальше →

Проблемы HR и поиск IT специалистов

Время на прочтение5 мин
Охват и читатели9.1K
Привет, уважаемые пользователи.

Решил я сегодня затронуть душещипательную, для многих, тему, как поиск нового места работы. Даже не так, пожалуй. Есть грамотные специалисты, о которых уже есть достаточно информации в сети. Но которые, тоже нуждаются в новых проектах.

И вот, многим специалистам-разработчикам приходят просто тонны спама от hr-менеджеров, которые сулят горы богатств, интересных проектов и сумасшедшие перспективы.

Попробую разобрать ситуацию в ходе исторического следования событий. И сразу буду давать ремарки.

Случай привожу вымышленный, но думаю, что многие увидят в нем что-то знакомое.

Итак, вы специалист с опытом работы более 5 лет. У вас за плечами опыт работы в разных компания, включая крупные и известные. Так же вы обладаете приличным портфолио небанальных работ. В сети есть ваши публикации. Например, о разработке, о разных проектах и т.п.
Читать дальше →
12 ...
54