Обновить
104.98

Статистика в IT

Статистика, исследования, тенденции

Сначала показывать
Период
Уровень сложности

Новый рекорд вычисления числа Пи

Время на прочтение1 мин
Количество просмотров39K
Французский программист Фабрис Беллар (известен также как основатель проектов FFmpeg и QEMU) на своём персональном компьютере под управлением Fedora 10 установил новый мировой рекод вычисления числа Пи с точностью до 2,7 трлн знаков после запятой (2242301460000 знаков в шестнадцатиричном разряде или 2699999990000 в десятичном). Это любопытное достижение, ведь рекорды за последние 14 лет ставились на суперкомпьютерах стоимостью в миллионы долларов.

Компьютер Беллара имеет следующие характеристики:

64-х битная версия Fedora 10
Процессор: Core i7, 2.93 ГГц
Память: 6 ГБ
Диск: пять дисков Seagate Barracuda 7200.11 по 1.5 ТБ
Файловая система: ext4
Читать дальше →

Пропажа одиннадцатого числа месяца и других дат

Время на прочтение6 мин
Количество просмотров38K


В ноябре 2012 года Рэндал Монро опубликовал комикс xkcd с календарём, в котором размер чисел каждого месяца был пропорционален тому, как часто это число упоминается в книгах по своему имени (например, «14 октября») в базе данных Google Ngrams с 2000 года. Большинство крупных дат довольно очевидны: 4 июля, 25 декабря, первое число каждого месяца, последнее число почти всех месяцев, ну и 11 сентября, оставляющее всех позади. Не так уж много дней выглядит сильно меньше остальных. К примеру, 29 февраля – крохотная точка. Но если приглядеться, можно увидеть, что 11 число каждого месяца относительно маленькое. К комиксу шло примечание: «Во всех остальных, кроме сентября, месяцах, 11-е упоминается гораздо реже остальных дат. Так было и до 11 сентября [2001], и я не знаю, почему это так». Я покопался в данных, и думаю, что разобрался, почему.
Читать дальше →

MyFin — удобный инструмент для ведения домашней бухгалтерии

Время на прочтение2 мин
Количество просмотров16K
Всем привет!

Хочу представить вам свою разработку. Это минималистичное и удобное средство для ведения домашней бухгалтерии. Вот скриншот для затравки:




Подробности под катом.
Читать дальше →

О странностях хабростатистики

Время на прочтение6 мин
Количество просмотров12K
И раньше замечал странное поведение рейтингов, но в последнее время странность проявилась слишком наглядно. И я решил исследовать проблему доступными мне научными методами, а именно: проанализировать динамику плюсования-минусования. Вдруг померещилось?

Программист я еще тот, но совсем элементарные вещи делать умею. Вот и закодил простенькую утилитку, собирающую статистику с панелей хабровского поста: плюсы, минусы, просмотры, закладки и прочее.



Статистика выводится в графики, после изучения которых удалось обнаружить еще пару неожиданностей, помельче. Но обо всем по порядку.
Читать дальше →

«Hello, World!» и прощай: Почему новички сливаются из IT быстрее, чем успевают написать первую программу

Время на прочтение5 мин
Количество просмотров49K

Эта статья — крик души. О слепой погоне за IT-мечтой, о курсах, которые обещают сделать из вас гуру программирования за три месяца, и о деньгах, которые якобы посыпятся на вас, как из рога изобилия.

Но за красивой картинкой — тысячи часов проб и ошибок, выгорание, бессонные ночи и жёсткая конкуренция. Готовы ли вы на самом деле к этому пути? Или просто верите в сказку?

Warning! Warning! Warning! В этой статье я буду душнить…

Читать далее

Как я искала эталон красоты с помощью Natural Language Processing (и не нашла)

Время на прочтение8 мин
Количество просмотров20K
Невозможно объективно измерить, какие девушки красивее: блондинки или брюнетки, смуглые или белокожие, высокие или миниатюрные. Но можно посчитать, какие черты внешности упоминают чаще, когда говорят о красоте.

У меня была неделя на эксперименты, наши движки анализа данных,16 тысяч русских романов и повестей XIX века и 15 тысяч современных длинных произведений. И, конечно, не было никаких размеченных данных.

Основная идея была в том, чтобы выделить из этой горы текстов фрагменты с описаниями красивых женщин, а потом из этих фрагментов извлечь частотные черты внешности.

Вот визуализация того, что получилось. Точнее, одного из распространённых вариантов.


Цвет глаз, волос, платье, рост, воспитание — всё это можно выделить из корпуса текстов.

Конечно, не всё так просто и однозначно как на рисунках, но примерное представление вы уже получили. Теперь давайте расскажу про детали и последовательность действий.
Читать дальше →

Почему домашняя батарея от Tesla — это кошмар для электрокомпаний

Время на прочтение2 мин
Количество просмотров99K
На прошлой неделе Илон Маск объявил, что Tesla создаст новый тип аккумулятора специально для дома. Дизайн уже готов, а производство начнется в течение следующих шести месяцев. Один полностью заряженный аккумулятор неделю будет обеспечивать среднего размера дом электричеством. Так стоит ли электрокомпаниям волноваться?

Вероятно, да — так как Маск входит в совет директоров SolarCity, компании-поставщика солнечных панелей, владеющей 39% потребительского рынка солнечной энергии в США.

image
Читать дальше →

Квазигосударство Amazon

Время на прочтение14 мин
Количество просмотров28K

Amazon — титан коммерции, маркетинговая платформа, сеть доставки и логистики, платежная служба, издательство, платформа для фильмов и сериалов собственного производства, ведущий хостинг облачных серверов. Вроде все круто. Но не все.

«Идиллия» оплачена тяжелым трудом, уходом от налогов и экономическими махинациями.

Читать далее

Решение парадокса Ферми от создателя Великого фильтра. «Громкие» и «жадные» инопланетяне

Время на прочтение5 мин
Количество просмотров36K


Робин Хенсон, который в 1996 году разработал гипотезу Великого фильтра, недавно вышел с новой моделью, над которой много лет трудился вместе с тремя другими учеными. Она довольно сложная, но полностью логичная, и без пробелов. Главные выводы: инопланетные цивилизации существуют, мы можем это математически доказать. Более того: у нас достаточно данных, чтобы примерно сказать, где они находятся в пространстве-времени, сколько их, и когда мы их встретим.

Читать дальше →

Убьёт ли введение 15%-го налога зарубежную интернет-торговлю

Время на прочтение6 мин
Количество просмотров53K


Неделю назад АКИТ предложила обложить все покупки россиян в иностранных интернет-магазинах дополнительным налогом 15%. Её можно понять. Несмотря на отважную борьбу этой организации, ФТС и других служб, объемы зарубежной торговли продолжают расти. В 2018-м они побили очередные рекорды: повышение достигло 24% за год, по итогам россияне потратили больше $10 млрд! Всё это в основном – без уплаты пошлин и НДС. Выгодно для покупателей, но не выгодно для крупных магазинов, налоговой и госбюджета.


Раз предыдущие меры оказались недостаточными, и иностранные покупки продолжают идти на повышение, пора принять что-то еще. Ранее правительство уже не раз прислушивалось к предложениям АКИТ. Не видим причины не послушаться и в этот раз.


Никаких приятных слов у нас по этому поводу нет. Очевидно, это может сильно ударить по отечественным покупателям, у которых станет меньше привлекательных опций. Но нам стало интересно, а на что реально повлияют эти 15% налога? Есть ли смысл у этой цифры, и на сколько реально нужно ввести налог, чтобы отбить у покупателей интерес к зарубежным площадкам?

Читать дальше →

ВКонтакте раскрыла свою статистику

Время на прочтение1 мин
Количество просмотров137K
11 сентября сайт vk.com переходит с TNS на LiveInternet и ComScore, а также раскрывает свою статистику посещений, которую можно посмотреть тут. Из этой статистики мне показалось интересным статистика по браузерам, OC и разрешениям экранов.

Читать дальше →

Ближайшие события

Важнейшая модель теории вероятностей

Уровень сложностиСредний
Время на прочтение14 мин
Количество просмотров16K

Что объединяет частицу в воде, биржевой курс и кота Барсика, бродящего по району в поисках ларька с рыбой?


Всё это — примеры случайного блуждания. Эта простая модель из теории вероятностей помогает описывать самые разные явления: от диффузии молекул до принятия решений и работы алгоритмов. Она кажется интуитивной — но за ней скрывается множество нетривиальных и красивых свойств.

Мы начнём с истории открытия броуновского движения — от наблюдений Роберта Броуна до формулы Альберта Эйнштейна, которая связала наблюдаемое явление с атомной гипотезой. Покажем, как идея случайного движения превратилась из гипотезы в надёжный инструмент научного анализа.

Затем перейдём к математической модели случайных блужданий, разберём, как она устроена и где используется. Научимся с ней работать: найдём среднюю скорость удаления, обсудим задачу о разорении игрока и вернёмся к нашему коту Барсику.

В завершение мы коснёмся неожиданной связи случайных блужданий с электрическими цепями, мыльными плёнками и графами — и покажем, как одна и та же задача может быть решена разными способами.

В финале — красивая задача для самостоятельного решения: её можно решить математически или запрограммировать симуляцию. Выбирайте способ по вкусу.

Читать далее

Всё-таки схождение к нормальному распределению происходит медленно

Уровень сложностиСложный
Время на прочтение9 мин
Количество просмотров11K

Многие реальные данные при использовании центральной предельной теоремы (ЦПТ) не сходятся быстро, поэтому не стоит применять её слепо. В этой статье мы разберём наглядные примеры этого и познакомимся с альтернативами для ЦПТ.
Читать дальше →

PornHub как замена VK

Время на прочтение2 мин
Количество просмотров92K


11 декабря PornHub опубликовал ежегодный отчет о своей работе в 2018. В 20 стран с наибольшим трафиком в этом году впервые вошла Украина. Занимая 16 место по трафику, украинские пользователи поднялись сразу на 11 позиций в сравнении с 2017 годом.


Неочевидной причиной столь резкого роста популярности PornHubʼа стал запрет вконтакте на территории Украины с мая 2017 года. Часть аудитории социальной сети, которая пользовалось вконтакте как PornHubʼом на протяжении последних полутора лет плавно мигрировала на PornHub.


Под катом много картинок графиков Google Trends, которые помогут детальней рассмотреть миграцию. Предпраздничная пятница, как раз время, чтобы анализировать поведение пользователей по времени, географическому расположению и видео предпочтениям.

Читать дальше →

Русская Википедия разом обогнала две другие Википедии и вышла на 8-е место

Время на прочтение1 мин
Количество просмотров1.5K
Многие всегда считали и сейчас считают, что русская Википедия занимает слишком низкое положение, не соответствующее статусу русского языка в мире и всегда боролись и борются за более достойное положение крупнейшей русской энциклопедии, да и вообще всего русскоязычного мира.

И вот только что произошли два радостных долгожданных события, которых мы ждали три года (с тех самых пор как мы 19 мая 2008 года обогнали шведов и попали фдесятку нах!). К нам пришли роботы, с миром! Сейчас русская Википедия одним махом обогнала нидерландскую и португальскую Википедии. Это стало возможным благодаря крупному проекту по созданию статей о реках России (статьи подготавливались заранее в течение нескольких месяцев живыми участниками, но только сейчас были разом опубликованы ботом).

Обгон нидерландской Википедии произошёл 24 февраля в 01:12 минут по московскому времени, когда в русской Википедии появилась 673 457-ая статья «Ыджидвож (приток Чукли)» (а может и «Шукшур»), написанная ботом «LatitudeBot».

Обгон португальской Википедии произошёл 24 февраля в 01:57 минут по московскому времени, когда в русской Википедии появилась 674 395-ая статья «Каз (приток Кондомы)» или «Кабурчак (приток Кондомы)», написанная всё тем же ботом «LatitudeBot».

via Wikipedia, здесь же см. обсуждение

Обновлённый список всех Википедий можно найти здесь.

Читать дальше →

Мошенники любят QR-коды: разбираем кейсы, изучаем устройство подделок и делаем выводы

Время на прочтение8 мин
Количество просмотров15K

К 2025 году мошенники превратили QR-коды в инструмент массового обмана. Один неверный клик — и ваши деньги исчезают со счета, смартфон заражается вредоносным ПО, а персональные данные оказываются в руках злоумышленников. Давайте разберемся, как QR-коды из удобного инструмента превратились в актуальную угрозу, как устроено такое мошенничество с технической точки зрения и что говорит статистика. А в конце немного потренируемся отличать поддельные коды от оригинальных. Прошу под кат.
Читать дальше →

Конверсия 1 собеседование на 500 откликов на западном рынке. Как так вышло и чем грозит?

Уровень сложностиПростой
Время на прочтение9 мин
Количество просмотров53K

Привет, меня зовут Артур, и это моя вторая публикация на Хабре. Я долго не решался опубликовать эту статью, переписывал её несколько раз и всё-таки в приятный пятничный вечер решил вынести эту тему на всеобщее обсуждение. Мне кажется, тема очень важной и актуальной. Несмотря на то, что она почти полностью посвящена ситуации с наймом на западном рынке, я уверен, что полезна и для нас, кто работает на местном рынке.

Обсудить я хочу тот кошмар с наймом, который происходит сейчас на западном рынке, так как это, кажется, иногда вырывается наружу, но о нём серьёзно в русскоязычном комьюнити не говорят. Но те, кто пытался или подаётся сейчас на западные вакансии, я думаю, прекрасно понимают, о чём будет эта статья. Я сам не Я сам не верил, пока не попробовал, желание разобраться, почему так произошло, взяло верх.

Читать далее

Backblaze: надёжность жёстких дисков падает год от года. Это актуально для HDD большинства производителей

Время на прочтение3 мин
Количество просмотров28K

Компания Backblaze, провайдер облачных сервисов, регулярно публикует отчёты о выходе из строя жёстких дисков, находящихся у неё в эксплуатации. HDD — сотни тысяч, поэтому статистика получается интересной. Правда, обычно такие отчёты выглядят более-менее одинаково: какие-то модели дисков выходят из строя чаще, какие-то реже.

А вот сейчас ситуация иная: согласно данным провайдера за 2023 г., надёжность жёстких дисков разных моделей от любых производителей снизилась. Есть и исключения, но в целом это так. Подробности — под катом.

Читать далее