Обновить
512K+

Статистика в IT

Статистика, исследования, тенденции

39,22
Рейтинг
Сначала показывать
Порог рейтинга
Уровень сложности

Влияние ИИ на рынок труда: новые методы оценки и первые данные

Уровень сложностиСредний
Время на прочтение2 мин
Охват и читатели2.6K

В этом материале представлены результаты исследования рисков вытеснения работников искусственным интеллектом.

| Если вам интересна тема AI-агентов и внедрения нейросетей, заглядывайте в мой Telegram-канал ДругОпенсурса. Там я публикую свежие новости и разборы инструментов в числе первых. |

Читать далее

Новости

Дом, который не построил Фишер

Уровень сложностиСредний
Время на прочтение7 мин
Охват и читатели6.9K

Про проверку гипотез в статистике написан уже миллион статей, и, боюсь, это даже не преувеличение. Зачем писать миллион первую? И чем она будет отличаться от привычных увещеваний вычислять p-value и сравнивать его с 0.05? Или от звучащих все громче призывов сдать это все в утиль и перейти уже наконец на сторону Байесовского Добра? К тому же у очередной статьи есть нешуточный риск не столько внести больше ясности в эту запутанную и довольно туманную историю, сколько запутать ее еще сильнее. Но я все же рискну.

Читать далее

Парадокс ансамблей: почему «слабые» модели иногда побеждают «сильные»

Время на прочтение3 мин
Охват и читатели7.7K

В ансамблевом прогнозировании важнее не индивидуальное качество моделей, а разнообразие их ошибок. Эксперимент показывает: пул из «худших» по отдельности моделей даёт лучшую точность ансамбля, чем пул из «лучших».

Читать далее

Производители вернули в продажу материнки с DDR3. Что происходит?

Время на прочтение5 мин
Охват и читатели11K

Рынок производства электроники сейчас нестабилен: цены на компоненты нового поколения растут, а сами эти элементы в дефиците. В итоге платформы, списанные со счетов еще несколько лет назад, неожиданно получают новый шанс. Именно так обстоят дела с материнскими платами, использующими память DDR3: те самые решения, которые многие считали музейными экспонатами, вдруг вернулись в продажу у целого ряда производителей. Давайте разбираться, что происходит.

Читать далее

Как более 100 000 специалистов оказались на рынке труда всего за один месяц

Уровень сложностиСредний
Время на прочтение4 мин
Охват и читатели63K

Март 2026 года. Не просто временный кризис, а трансформация всей ИТ-индустрии. Конец эпохи количественного найма и переход к стратегии экстремальной плотности талантов.

Люди внезапно стали слишком дорогим и медленным интерфейсом по сравнению с алгоритмами. Корпорации активно соревнуются в том, кто быстрее избавится от человеческого фактора в пользу вычислительных мощностей. Март и начало апреля 2026 года стали настоящей черной полосой для сотрудников среднего звена.

Для Бигтеха это был месяц «великого перехода»: вместо того чтобы платить людям зарплаты, они перенаправили эти миллиарды на закупку чипов и строительство дата-центров. Март 2026-го войдет в историю как момент, когда корпорации окончательно перестали стесняться увольнять сотрудников.

Читать далее

Почему дорогая память DDR5 внезапно начала дешеветь и что это значит для рынка

Время на прочтение5 мин
Охват и читатели62K

Рынок оперативной памяти снова меняется, причем довольно резко. Цены на DDR5, которые еще в начале 2026 года росли почти без остановки, вдруг пошли вниз. Отдельные комплекты подешевели очень заметно — на сто долларов и больше, хотя месяцем ранее такое казалось невозможным. Что стряслось, ведь еще недавно участники рынка говорили об «идеальном шторме» дефицита и цен? Здесь основной фактор — искусственный интеллект и соответствующая инфраструктура. Давайте разбираться. 

Читать далее

Атакующий трафик вчера, сегодня, завтра: про актуальные реалии и DDoS-вызовы

Уровень сложностиСредний
Время на прочтение8 мин
Охват и читатели8K

Рассказываем про собственную статистику DDoS-атак за 2025 и первый квартал 2026 года — и через эту призму размышляем об эволюции DDoS как явления в целом.

Читать далее

Дайджест технических новостей, переводов и лонгридов инфослужбы Хабра за март 2026 года

Время на прочтение6 мин
Охват и читатели7.7K

В марте 2026 года информационная служба Хабра выпустила 995 публикаций (930 новостей и постов, 7 лонгридов и 58 переводов). В текущем дайджесте представлены лучшие технические новости, переводы и лонгриды (отдельные большие публикации) инфослужбы Хабра, согласно оценкам пользователей.

Читать далее

Волшебная палочка аналитика — калькулятор Эвана Миллера

Уровень сложностиПростой
Время на прочтение3 мин
Охват и читатели5K

Добрый день, дорогие любители аналитики!

А/В тестирование - это инструмент, который позволяет с помощью экспериментов увеличить прибыль компании, привлечь новых пользователей и выбрать наиболее эффективный канал рекламы.

Вы сформулировали гипотезу, определились как оцените результаты и теперь нужно правильно определить размер выборки.

Рассмотрим полезный инструмент для А/В тестирования — калькулятор Эвана Миллера.

Данный калькулятор помогает определить выборку, то есть количество пользователей, кликов или других элементов, участвующих в эксперименте.

Определение правильного размера выборки значительно влияет на результат А/В тестирования, так как недостаточный объем выборки приведет к высокой вариативности, то есть мы не достигнем статистически значимого результата. А при очень большой выборке мы потратим лишнее время, ресурсы, что тоже в условиях динамичной жизни будет неэффективно.

Читать далее

Kimi K2.5 наступает на пятки GPT-5.4. И работает из России без VPN

Уровень сложностиПростой
Время на прочтение6 мин
Охват и читатели18K

Бенчмарков сейчас – как нейросетей: каждую неделю новый. GPQA Diamond тестирует PhD-знания. Lexometrica проверяет фактическую точность. LLM Persuasion Benchmark – способность убеждать в дебатах. Chatbot Arena – предпочтения живых людей. Резонный вопрос: зачем ещё один?

Два ответа. Первый: ценность бенчмарков – в перекрёстном подтверждении. GPT-5.4 – первое место у нас, в GPQA Diamond, в Lexometrica и в Persuasion Benchmark. Kimi K2.5 – шестое и у нас, и у Lexometrica. YandexGPT и GigaChat – внизу везде, где они вообще есть (в GPQA Diamond из 154 моделей – не попали). Четыре независимых бенчмарка – один и тот же вердикт.

Второй – важнее. Мы не нашли ни одного систематического бенчмарка, который тестирует российские модели бок о бок с глобальными на практических задачах. Если знаете такой – напишите в комментариях.

Наше исследование: 54 модели, 32 сценария на русском языке, промпты как пишет живой менеджер, два LLM-судьи с калибровкой. Обновление предыдущей статьи. Интерактивные результаты – на сайте.

Детали по исследованию

Как оценить акцию без A/B-теста: от простых способов к сложным

Уровень сложностиСредний
Время на прочтение6 мин
Охват и читатели4.9K

Как правильно оценивать влияние кампаний, если А/В-тест не возможен? Рассмотрим несколько вариантов: от самых простых к не самым, но сложным.

Читать далее

Зависимости, которых не существует: как фильтрация искажает данные и что такое коллайдеры

Уровень сложностиПростой
Время на прочтение7 мин
Охват и читатели5.2K

График, который вы видите очевидно показывает отрицательную зависимость между a и b, однако этой зависимости не существует. Да, зависимости между a и b нет, а видите вы коллайдер - одну из самых коварных ошибок статистики. Коварную потому, что прячется за здравый смысл. Мы делаем вполне разумные действия, а получаем связи между независимыми данными.

Разбираем на пальцах как появляются коллайдеры и как не попасть в их ловушку.

Читать далее

Как с помощью A/B-платформы найти лучшее решение, если вариантов слишком много, чтобы тестировать все?

Уровень сложностиСредний
Время на прочтение12 мин
Охват и читатели6.4K

Привет, Habr! Меня зовут Костя Козлов, я работаю в команде анализа и валидации экспериментов A/B-платформы Ozon. В предыдущей статье коллеги рассказали, как создать высокопроизводительную платформу сплитования пользователей на группы и стенд метрик. В этой статье расскажу, как построить поверх этого инструмент, который автоматически оптимизирует бизнес-метрики продукта за счёт "умного" перебора возможных вариантов его параметров.

Статья будет касаться всех кейсов, где необходимо найти оптимальные по бизнес-метрикам непрерывные параметры системы на данных из онлайн-экспериментов. Например, у вас есть алгоритм рекомендаций товаров, и вы хотите за счет настройки его параметров вырастить число заказов, не уронив при этом рекламную выручку.

Читать далее

Ближайшие события

Треть специалистов попробовала удалёнку — и никто не уехал: почему дезурбанизация в России буксует, а в США — взлетела

Уровень сложностиСредний
Время на прочтение8 мин
Охват и читатели11K

Снятся ли программистам на удалёнке гусиные фермы? В Америке это уже не совсем шутка — сотни тысяч удалёнщиков действительно переехали из города. В России 87% молодых горожан «рассмотрят переезд», реально хотят — 4%. Между этими цифрами — обрыв. Где именно ломается воронка и при чём тут AI — под катом.

Читать далее

Пари века

Время на прочтение14 мин
Охват и читатели16K

"Они, вероятно, напишут книги с названиями вроде «Как я превратил доллар в миллион за 20 дней, работая по 30 секунд в день». Ещё хуже: они начнут летать по стране, посещать семинары по "эффективному подбрасыванию", спорить с профессорами: «Если это невозможно, то почему нас 215?»"

Читать далее

ИИ — не панацея

Уровень сложностиСредний
Время на прочтение4 мин
Охват и читатели6.9K

Недавно мы с командой проанализировали инфополе Хабра и обнаружили, что эйфория от внедрения ИИ в разработку сменяется разочарованием, senior-разработчики тонут в ревью некачественного кода, а техдолг растет как снежный ком. Мы сами проходим через этот путь, внедряя GenAI в SimpleOne, и прекрасно понимаем вашу боль. 

Всем привет, я Артем Герасимов, владелец продукта SimpleOne SDLC. В этой статье я расскажу о реальных проблемах ИИ-генерации кода и о том, какие механизмы помогают нам с ними справляться.

Читать далее

У вас скорее всего не получится сделать статистически обоснованный подбор личных жизненных привычек и БАДов

Уровень сложностиСредний
Время на прочтение17 мин
Охват и читатели11K

Допустим, вас не устраивает ваше качество сна. Вы перестали делать очевидно вредные вещи (убрали кофе на ночь), и сон улучшился, но хотелось бы поработать над ним ещё. Коллега по работе даёт вам смесь трав со зверобоем и лавандой. Вы пробуете пить его на ночь вместо кофе, и иногда сон действительно становится глубже. Но иногда нет. Вы готовы экспериментировать, но как бы проверить, действительно ли травы работают или это просто случайный разброс?

Или допустим, вы не очень довольны вашей продуктивностью на работе. По заветам из "Atomic Habits" и книг по эргономике вы внедрили несколько полезных микропривычек. Но что делать, когда низковисящие фрукты закончились? Время ограничено - всего, что кто-то называет полезным, не сделать. Некоторые привычки ещё и взаимоисключающие: невозможно за обедом одновременно и общаться с кем-то и сидеть в одиночестве в тишине.

Или например, вы хотите достичь более хороших показателей на рыболовном поприще... вы поняли идею.

"Не недооценивайте силу малых вещей, взятых в большом количестве", - мысль мудрая, но как бы понять, какие именно малые вещи действуют конкретно в вашей ситуации? Если вы проходили курс статистики, то у вас в голове есть набросок ответа. Выделить целевую метрику, собрать историю данных, затем собрать набор данных после выбранного вмешательства, сравнить средние значения метрики до и после - и готов научно обоснованный ответ. Проблема в том, что если ввязаться в подобный проект без основательного плана, вы в итоге окажетесь с ворохом бесполезных цифр в таблице. Почему именно эта затея не для слабых духом мне бы и хотелось рассказать в этой статье.

Читать далее

Учимся предсказывать конверсию в опросах. Часть 2

Уровень сложностиПростой
Время на прочтение6 мин
Охват и читатели4.7K

Всем привет! На связи Айкович Ульяна и команда Pathway. Месяц назад мы опубликовали первую часть, в которой рассказали о нашем эксперименте по предсказанию конверсии в прохождение опросов. Сегодня мы поделимся, как можно предсказать конверсию в опросах, а также как составить ваш опрос, чтобы пользователи активнее прошли его до конца.

Каждый UX-исследователь в своей жизни сталкивался со сложностями при наборе статистически  значимого количества участников в опросах: кто-то не проходит дальше первого вопроса, кто-то бросает на полпути. Может ли исследователь повлиять на конверсию прохождения опроса? Наш ответ — да!
В данной статье мы поделимся итогами регрессионного анализа и дадим лайфхаки по составлению опроса на основе такой модели.

Читать далее

Одна Rust-библиотека вместо шести Python-пакетов — или как я перестала запускать фит и идти за кофе

Уровень сложностиСредний
Время на прочтение12 мин
Охват и читатели17K

Кому будет полезно

Если вы живёте в Python и одновременно используете statsmodels, lifelines, pyhf, PyMC/BlackJAX, linearmodels (или что‑то похожее).

Если вам важны воспроизводимость и понятная валидация численных оптимизаций (особенно в HEP).

Если вам интересна архитектура «одно вычислительное ядро → много задач» и практические hot paths (AOT, SIMD, zero‑copy).

Читать далее

5 SQL‑ошибок

Время на прочтение3 мин
Охват и читатели19K

Когда регулярно ревьюируешь чужой код или менторишь младших коллег, начинаешь замечать паттерны. Есть ошибки, которые кочуют из скрипта в скрипт, и совершают их не только джуны, но и вполне уверенные специалисты.

Сегодня разберем пять неочевидных нюансов SQL, которые могут незаметно исказить бизнес-метрики, сломать воронку или просто заставить базу выполнять лишнюю работу.

Читать далее
1
23 ...