Обновить
33.22

Статистика в IT

Статистика, исследования, тенденции

Сначала показывать
Период
Уровень сложности

Обзор макроэкономических показателей связи РФ: 2014-2023

Время на прочтение5 мин
Охват и читатели1.5K

Некоторое время назад мы начали мониторинг статистических и экономических показателей в рамках нашего проекта SETEWIKI, в котором мы отслеживаем состояние «здоровья» российской связи.  

Сегодня мы предлагаем вашему вниманию первые наблюдения по итогам работы раздела «Экономика связи РФ», в котором собраны данные с 2014 года по нескольким направлениям:

Читать далее

Фреймворк для дизайна A/B-теста

Время на прочтение11 мин
Охват и читатели10K

Сегодня мы рассмотрим простой базовый фреймворк для дизайна сплит-теста, который можно удобно использовать продуктовым аналитикам в своей работе. Разберем использование этого фреймворка, его теоретическую и математическую основу, и также поговорим о продуктовых аспектах заведения A/B-тестов — когда продакту и аналитику заводить A/B-тест не нужно. Вам понадобятся: представления о продуктовых метриках, знания python, первичные представления о математической статистике и чуточку воображения.

Читать далее

Скоро iOS 17, смотрим статистику по старым версиям

Уровень сложностиПростой
Время на прочтение3 мин
Охват и читатели7.6K

На подходе обновление iOS до версии 17 (понедельник - 18.09.23) .

Для простых пользователей это повод отключить автообновление (кто использует).

А для QA (если не работали с бэткой) - самое время ревизии парка устройств.

Не пропустите!

Немного статистики

Шифровальщики атакуют образовательные учреждения

Уровень сложностиПростой
Время на прочтение4 мин
Охват и читатели2.8K

Наши эксперты проанализировали актуальные киберугрозы за I квартал 2023 года. Исследование показало увеличение числа уникальных инцидентов и всплеск активности вымогателей, особенно в отношении научных и образовательных учреждений. Мы фиксируем появление большого числа фишинговых писем, связанных с трудоустройством, возникновение QR-фишинга и увеличение количества вредоносной рекламы.

Подробнее

Сходить налево: что делать, если сотрудники фрилансят на рабочем месте

Уровень сложностиПростой
Время на прочтение6 мин
Охват и читатели14K

Парадоксально, но несмотря на дефицит ИТ-специалистов на рынке, они часто недозагружены задачами. Об этом говорит тот факт, что многие из айтишников регулярно занимаются фрилансом на рабочем месте. В ответ работодатели ставят тайм-трекеры, а это, в свою очередь, отпугивает новых кандидатов.

Хочу поговорить о том, есть ли менее непопулярные методы предотвратить подработку персонала. А еще — когда ее можно не предотвращать, а обратить себе на пользу.

Читать далее

Самые востребованные IT-профессии 2022-го. Итоги года

Время на прочтение9 мин
Охват и читатели56K

Данные и зарплаты



Разбираем самые востребованные IT-специальности 2022 года: почему они так популярны, сколько платят айтишникам сегодня, где получить нужный навык и как влиться в сферу. А еще, конечно, делаем прогнозы, чтобы понять, какой опыт и IT-профессию выбрать в 2023.

Читать дальше →

Анализ вакансий ИТ в Москве: системное администрирование

Время на прочтение10 мин
Охват и читатели6.9K

Рассмотрим предложения для системного администратора на рынке труда в Москве.

Данная информация понадобилась для планирования фонда оплаты труда специалистов на следующий год, а также для понимания: "насколько сильно рынок убежал от текущих зарплат". Кроме организаций, такой анализ может дать мотивацию сотрудникам данной профессии для спроса индексации с работодателя или смены работы на более оплачиваемую, а может даже сдвинет в сторону саморазвития и продвижения по карьерной лестнице.

Читать далее

Расчет и анализ корреляционного отношения средствами Python

Время на прочтение21 мин
Охват и читатели32K

Расчет и анализ корреляционного отношения средствами Python.

Читать далее

Telegram bot на aiogram + Google Analytics 4

Время на прочтение3 мин
Охват и читатели13K

Статья о том как удалось прикрутить гугл аналитику к Telegram боту на aiogram.

Дело в том, что гугл объявил о закрытии Universal Analytics и полном переходе на Google Analytics 4. Погуглив стало ясно что инфы про новую аналитику крайне мало, а о её работе с питоном инфы в принципе нет.

Поскольку это телеграм бот, где нет доступа к фронтэнду, нам не подходят стандартные способы сбора аналитики. А так же любые библиотеки, которым так славится питон, являются устаревшими из-за перехода на новую версию.

В качестве примера будет использоваться python + aiogram, но здесь описывается взаимодействие с api аналитики посредством обычных http запросов. Так что статья актуальна для любого языка.

Читать далее

Аутсорсинг как быстрый способ усилить компанию

Время на прочтение4 мин
Охват и читатели4.6K

Сегодня все чаще малый и средний бизнес отдает некоторые работы на аутсорсинг, это может быть клининг, бухгалтерия, поиск и найм необходимого кандидата или реализация работ для заказчика, которые компании выгоднее отдать на аутсорсинг чем выполнять самостоятельно. Причин в общем то много, порой на аутсорсинг отдают целые бизнес-процессы - например продажи.

Чаще всего в таких случаях мы говорим о достаточно простых и понятных процессах, в которых не нужны высококвалифицированные специалисты. Это действительно снижает затраты и дает возможность компаниям нарастить свои обороты. Тем не менее, такой тип работы с аутсорсингом больше похож на “крутить педали сильнее и быстрее” или “купить 2 велосипеда вместо одного” вместо того, чтобы пересесть в автомобиль и двигаться вперед в совершенно ином темпе. 

И есть еще множество подобных историй

Кто больше зарабатывает: специалист с образованием или с опытом?

Время на прочтение5 мин
Охват и читатели11K

К старту флагманского курса по Data Science делимся небольшим исследованием о зарплате на основе данных опроса Stack Overflow, а также очень кратко знакомим читателей с библиотекой построения байесовских моделей Bambi. За подробностями приглашаем под кат.

Читать далее

Тенденции DDoS-атак в 4-м квартале 2021 года

Время на прочтение10 мин
Охват и читатели2.8K

Помните сентябрьскую DDoS-атаку на Хабр? К старту курса по этичному хакерству делимся отчётом Cloudflare за последний квартал прошлого года, чтобы лучше понимать, к чему готовиться сегодня.

Читать далее

F-тест качества спецификации множественной регрессионной модели

Время на прочтение4 мин
Охват и читатели15K

Здравствуй, Хабр!

Цель этой статьи — рассказать о роли степеней свободы в статистическом анализе, вывести формулу F-теста для отбора модели при множественной регрессии.

Читать далее

Ближайшие события

Рынок IT-вакансий: куда бежать и, главное, зачем

Время на прочтение5 мин
Охват и читатели28K

Современные реалии таковы: спрос на IT-специалистов значительно выше их количества, зарплаты растут, а миграция кадров перестала быть сезонным явлением. Многочисленные курсы обещают низкий порог входа, а работодатели готовы вкладывать деньги и силы в обучение даже потенциальных сотрудников. Как тут не решиться на переход в IT?

С помощью нашего сервиса @Getmeit_bot мы смогли собрать любопытную статистику, отражающую основные тренды рынка найма IT-специалистов за последнее полугодие. Они помогут начинающим специалистам определиться со своим карьерным путем, а уже состоявшимся — сформировать представление, с чем выходить на рынок найма и куда двигаться дальше с целью карьерного роста.

Читать далее

Python, корреляция и регрессия: часть 2

Время на прочтение12 мин
Охват и читатели41K

Предыдущий пост см. здесь. Этот пост посвящен регрессии.

Хотя, возможно, и полезно знать, что две переменные коррелируют, мы не можем использовать лишь одну эту информацию для предсказания веса олимпийских пловцов при наличии данных об их росте или наоборот. При установлении корреляции мы измерили силу и знак связи, но не наклон, т.е. угловой коэффициент. Для генерирования предсказания необходимо знать ожидаемый темп изменения одной переменной при заданном единичном изменении в другой.

Читать далее

Python и статистический вывод: часть 4

Время на прочтение11 мин
Охват и читатели14K

Этот заключительный пост посвящен анализу дисперсии. Анализ дисперсии, который в специальной литературе также обозначается как ANOVA от англ. ANalysis Of VAriance, — это ряд статистических методов, используемых для измерения статистической значимости расхождений между группами. Он был разработан чрезвычайно одаренным статистиком Рональдом Фишером, который также популяризировал процедуру проверки статистической значимости в своих исследовательских работах по биологическому тестированию.

Читать далее

Как выбрать уровень статистической значимости для AB-теста и как интерпретировать результат

Время на прочтение10 мин
Охват и читатели19K

AB-тесты сейчас применяет, возможно, каждый второй менеджер продукта, однако далеко не всегда ясно, как же интерпретировать результат теста и какой уровень статистической значимости использовать. Используем слишком высокий - тесты возможных улучшений будут проваливаться, хотя улучшения на самом деле есть. Используем слишком низкий - часто будем получать "подтверждения" ложных улучшений.

Независимо от выбранного уровня значимости, принимая решения по результатам AB-тестов, время от времени мы будем ошибаться и наносить ущерб бизнесу. Выбирая уровень статистической значимости тестов (или что то же самое - граничные p-value), мы можем ограничить количество ошибок и балансировать между пользой от оправданно успешных экспериментов и ущербом от ошибочно успешных.

Читать далее

Статистика зарплат Java-разработчиков: максимальные ожидания от зарплат в Москве, а джунам платят меньше всего в Самаре

Время на прочтение3 мин
Охват и читатели38K

Или статистика зарплат Java-разработчиков.

Сколько зарабатывают джуны, мидлы и сеньоры и сколько хотят зарабатывать, как разнится доход Java-разработчиков в разных городах? Мы решили пройтись по статистике за 2020 год, который собирает наш бот в Телеграм: рассмотрели ожидания кандидатов в зависимости от уровня в разных регионах, и посмотрели средние зарплаты в 12 городах, проанализировали и сделали графики для наглядности. Вот что у нас получилось. Все цифры приведенные в аналитике средние, с зарплатным коридором, и указаны «на руки».

Читать далее

Интерес к коронавирусу COVID-19 в сети Интернет. Что ищут, сколько, где и как? Посмотрим Яндекс.Вордстат и Гугл.Тренды

Время на прочтение2 мин
Охват и читатели21K
Коронавирусы известны давно, но только с появлением COVID19 интерес к новому вирусу со стороны обывателей возрос в сотни раз. Разумеется, заслуга в этом и СМИ, и влияния самого вируса с особенностями его распространения, и попыток государств в предотвращении распространения пока малоизученной инфекции и минимизации ущерба.

Стало любопытно последствие интереса людей в РФ и стран СНГ по теме коронавирусной инфекции. За основу возьмем данные числа запросов в поисковой системе Яндекс:

История запросов коронавирус
Читать дальше →

Подборка занимательных статистических фактов #5

Время на прочтение2 мин
Охват и читатели4K
Подборка графиков и результатов различных исследований c короткими аннотациями от автора Телеграм канала Groks.



Забавный график, свидетельствующий о дискриминации роботов. Результативность необозначенных чат-ботов сопоставима с уровнем профессиональных продажников, и они в четыре раза эффективнее неопытных сотрудников с точки зрения стимулирования покупок. Но если идентичность чат-бота обозначена до начала диалога с клиентом, продажи падают на 80%.

Я не особо слежу за законотворчеством в контексте искусственного интеллекта, однако мне помнится, что после дилеммы с Google Duplex в США было принято решение обязать ботов сообщать людям о том, что они боты.

Когда-то я писал, что контактные центры за год обрабатывают порядка 268 млрд звонков и это стоит около $1,6 трлн. На минуточку, глобальный рынок рекламы раза в два меньше. А теперь задумайтесь, каким огромным квази-налогом является решение этической проблемы ботов.
Читать дальше →