Обновить
58.19

Статистика в IT

Статистика, исследования, тенденции

Сначала показывать
Период
Уровень сложности

25% хакеров в США — информаторы ФБР

Время на прочтение3 мин
Охват и читатели1.5K
imageВ английской Guardian на днях было опубликовано занимательнейшее исследование, в ходе которого выяснился любопытный факт — как оказалось, в США один из четырех специалистов по компьютерным технологиям является информатором ФБР.

Бюро расследований и секретная служба использовали самое действенное средство — угрозу тюремного заключения, для того чтобы построить целую сеть доносчиков в среде криминальных представителей Интернета.

Подпольный мир Интернета наполнен паранойей и недоверием, сообщает газета. Что не удивительно, учитывая названное количество людей, для которых принципы омерты являются лишь пустым звуком.

В некоторых случаях, нелегальные форумы, используемые лицами с не самыми честными намерениями для, скажем, продажи украденных личностных данных, или банковских данных, были созданы и поддерживаются теми, кто висит на крючке у ФБР. В других случаях, агенты сами выступают в качестве кардеров, получая права модерации (или любого другого контроля) и, вследствие, сажая за решетку не одного-двух нарушителей, а целые группы.

Эрик Корлей (Eric Corley), проведший это исследование, говорит что: «Человек, заработавший себе на серьезный тюремный срок, почти всегда хватается за предложение властей, становясь глазами и ушами служб безопасности. Учитывая, каким опытом обладает большинство из них, они очень уязвимы к запугиванию».

«Это делается для большего напряжения взаимосвязей», отмечает Джон Янг (John Young), владелец Cryptome — веб-депозитария для секретных документов по линии WikiLeaks. «Есть десятки, если не сотни людей, которых сдали те люди, которым они доверяли больше всего».
Читать дальше →

Мода на медиану

Уровень сложностиПростой
Время на прочтение3 мин
Охват и читатели15K

У доски стоит менеджер и обосновывает фичу, показывая медианные значения. На задней парте в обнимочку, с попкорном, сидят аналитик с датасайентистом.

Читать далее

Падение спроса на ноутбуки со смартфонами сказалось на производителях DRAM-памяти — выручка падает

Время на прочтение4 мин
Охват и читатели8K

Около года назад мы писали о том, что падения цен на DRAM и SSD в скором времени ждать не стоит. И действительно, стоимость чипов для производства планок памяти и твердотельных накопителей продолжала расти. Случались периоды, когда цена немного падала, но общая тенденция была понятной — все дорожает.

Факторов, которые привели к подобной ситуации, несколько. Это и дефицит сырья для производства электроники, и торговая война США с Китаем, плюс постоянно растущий спрос на чипы и электронные системы. Сейчас цены продолжают держаться, но вот спрос на ноутбуки, смартфоны и ПК падает, о чем мы писали пару дней назад. И, похоже, изменение спроса довольно серьезное — настолько, что этот фактор повлиял на рост выручки производителей оперативной памяти. Она начала снижаться, что еще несколько месяцев назад представлялось невозможным — практически все игроки рынка получали сверхприбыли.
Читать дальше →

Как цифровой бизнес спасёт мир. Теперь уже точно

Время на прочтение6 мин
Охват и читатели6.8K
Не так давно все мы стали свидетелями того, как цифровые сервисы и решения, облегчили и даже спасли жизнь людей во время изоляции. Примеров множество. Люди могли продолжать работать, лечить, обучать, заниматься спортом с помощью целого ряда платформ конференц-связи. Они активно пользовались сервисами заказа средств индивидуальной защиты, продуктов, медикаментов. Государство и бизнес сумели оперативно скоординироваться и запустить порталы Все.онлайн и Доступвсем.рф. Существенно расширился перечень государственных онлайн-услуг. Если для многих в эпоху «до пандемии» утверждение, что переход на цифру является жизненной необходимостью, было лишь громкими словами, то теперь стало очевидно — и в горе, и в радости цифровые инструменты являются залогом устойчивости бизнеса, его выживания и развития. 

Строго говоря, пандемия коронавируса только ускорила уже давно назревавший процесс неизбежного во всех секторах цифрового преобразования, стала его катализатором, заставила сменить приоритеты представителей оффлайн экономики. Например, она подтолкнула Х5 Retail Group к масштабированию сервиса экспресс-доставки «Пятерочки», а Сбербанк — к расширению спектра доставки Сбер-Маркета и запуску сервиса для поддержки людей старшего поколения в рамках DocDoc.

В этом контексте нашей команде в ЛАНИТ показалась очень полезной вышедшая не так давно статья Брайна Вонга, вице-президента из Alibaba Group — компании, являющей один из гениальных примеров успешных бизнес-экосистем. Предлагаем вашему вниманию перевод этой статьи и призываем поговорить в комментариях, действительно ли, по вашему мнению, кризис — это время возможностей, и оказались ли адепты цифровизации в более выгодном положении в период пандемии. 

Источник: REUTERS / Джон Сибли
Читать дальше →

Где в России убивают больше всего? Анализ данных

Время на прочтение7 мин
Охват и читатели55K
Привет, Хабр.

Меня зовут Алексей Кнорре, и я криминолог, аспирант в UPenn и аффилированный научный сотрудник в ЕУСПб. Подумал, что сейчас, после месяцев карантина, самое время рассказать о преступности. Неясная экономическая ситуация, рост безработицы, ухудшение общественного здоровья — все это вызывает опасения в завтрашнем дне. Что будет с преступностью в России? Как криминолог, я использую статистические методы и программирование для того, чтобы эмпирически исследовать преступность, поэтому я постоянно работаю с данными, о которых сегодня и хотел бы рассказать доступным языком. На Хабре было всего два поста по тегу «криминология», поэтому надеюсь, мой рассказ будет интересным.

Кто-то из вас мог видеть в прошлом году рейтинг безопасности городов России. Как собирали данные о безопасности: вроде бы был опрос жителей, но сколько человек опросили? Не было ли в выборке систематических смещений, как если бы опрашивали только жителей больших многоквартирных домов? Насколько вообще люди могут точно сказать, что в их городе в целом безопасно? Безопасно по сравнению с чем, и как эту безопасность измерить? А вдруг анкетный опрос отражает больше общественные настроения, нежели реальную преступность — вероятность случайного нападения на улице, грабежа или кражи?

В науке преступность измеряют разными способами. Два года назад мы с коллегами, например, провели первый в России репрезентативный виктимизационный опрос, обзвонив 16 тыс. человек. Данные мы открыли для общего пользования. Основной вывод — уровень реальной преступности где-то в 8 раз выше регистрируемой правоохранительными органами. Вот визуализация процесса от Марии Бублик и Натальи Тогановой, вошедшая в шорт-лист премии Information is Beautiful — 2019.


Читать дальше →

Можно ли заработать больше, работая инженером, в другой стране?

Время на прочтение6 мин
Охват и читатели46K

Содержание:


Как можно сейчас сравнивать страны по стоимости жизни?
Про паритет покупательной способности
Почему BIM (инженеры и координаторы)
Вывод 1. Разное брутто — равное нетто
Вывод 2. Чем меньше брутто, тем больше m²
Откуда брались данные
Методология расчета показателей ППС

Довольно часто в разговоре с людьми из других стран мы начинаем сравнивать уровни заработной платы. Хотя валовой доход может существенно отличаться, покупательная способность, скорее всего, останется примерно на одном уровне, что особенно очевидно на рынке недвижимости.
Действительно ли трава «зеленее» — на той, другой стороне?
Читать дальше →

Backblaze опубликовала статистику надёжности HDD за 2018 год

Время на прочтение3 мин
Охват и читатели60K


Более пяти лет назад компания Backblaze опубликовала первый отчёт по использованию дисковых накопителей в своих серверах. Backblaze предоставляет услугу дешёвого облачного бэкапа. В основе их инфраструктуры — жёсткие диски потребительского класса. Компания собрала большую статистику по отказоустойчивости разных типов HDD. В то время парк накопителей Backblaze состоял в основном из дисков Seagate, Hitachi и WD, а самыми надёжными оказались диски Hitachi.

С тех пор Backblaze публикует статистику ежегодно, и сейчас пришло время очередного отчёта.
Читать дальше →

Дефицит чипов может стать еще более ощутимым: проявляются новые факторы давления на индустрию

Время на прочтение5 мин
Охват и читатели24K

О нехватке чипов, дефиците исходных ресурсов и других проблем отрасли производства полупроводниковых элементов пишут многие СМИ. На Хабре эта проблема упоминалась не раз и не два — ведь она действительно очень серьезная, она влияет на производство не только электронных устройств, но и на автомобилестроение, производство бытовой техники и другие отрасли. Среди основных проблем, которые усугубляют кризис, называются торговые войны США и Китая, ограничение поставок исходных материалов Китаем, повышение пользовательского спроса на ноутбуки, ПК и другие устройства.

Негативных факторов гораздо больше, чем перечислено выше. Они очень сильно давят на рынок, и сейчас отрасль попала в идеальный шторм. Но как будто бы этого было недостаточно — появляются новые негативные факторы, усугубляющие и без того сложную ситуацию. Обо всем этом — под катом.
Читать дальше →

Рейтинг языков программирования 2021: доля Python падает, а TypeScript обошел С++, в лидерах JavaScript, Java, C#

Время на прочтение4 мин
Охват и читатели188K

Украинский профильный ресурс DOU.UA провел очередной ежегодный опрос о языках программирования, в рамках которого было собрано 7211 анкет (92% респондентов находятся в Украине). Из интересного - впервые с 2014 года у Python отрицательная динамика, наблюдается тенденция перехода с JavaScript на TypeScript, наиболее довольны пользователи Elixir, и наконец на графиках появился Rust.

Читать далее

Сколько доменных имён .com не используется?

Время на прочтение5 мин
Охват и читатели31K
При поиске свободного имена в зоне .com меня неприятно удивило количество уже занятых, но неиспользуемых доменов. Судя по всему, зарегистрированы все произносимые комбинации букв на всех основных языках мира. И даже непроизносимые короткие комбинации. То ли существует большой рынок доменов, то ли мне просто на ум приходят те же имена, что и всем остальным? Посмотрим на голую статистику…

В настоящее время зарегистрировано 137 миллионов доменных имён .com. По данным Verisign, в «активной зоне» по состоянию на 27.01.2019 года есть 137 756 106 доменов .com. Перед этим я сверил корректность цифры с файлом DNS-зоны.

Из них используется около трети (предприятия, личные веб-сайты, электронная почта и т. д.). Ещё треть, по-видимому, не используется, а последняя треть используется в различных спекулятивных целях.
Читать дальше →

Самые надежные SSD: результаты эксперимента продолжительностью в полтора года

Время на прочтение3 мин
Охват и читатели136K


Современные SSD-накопители достаточно надежные, а с учетом того, что цена за 1 ГБ (в долларах) постепенно падает, то использовать SSD во многих случаях даже более рационально, чем работа с HDD. Но какой SSD выбрать?

Полтора года назад журналист Tech Report решил провести эксперимент по выявлению наиболее надежных SSD. Он взял шесть моделей накопителей: Corsair Neutron GTX, Intel 335 Series, Kingston HyperX 3K, Samsung 840, Samsung 840 Pro, и поставил все шесть на цикличный процесс чтения/записи. Объем памяти каждого накопителя составлял 240-256 ГБ, в зависимости от модели.
Читать дальше →

Россия в пятёрке крупнейших интернет-стран

Время на прочтение1 мин
Охват и читатели1.9K
Согласно свежеопубликованному отчету Morgan Stanley, Россия вошла в пятерку стран с самым большим интернет рынком.

image

Сегодняшняя интернет аудитория в России:
  • составляет 60 млн. пользователей или 42% населения;
  • выросла на 31% за последний год – это самый быстрый рост в пятёрке;
  • активно перемещается на мобильные устройства – охват скоростного мобильного интернета (3G) вырос за год на 81% и достиг 5% аудитории.

Парадоксы в данных, и почему визуализация бывает необходима

Уровень сложностиПростой
Время на прочтение6 мин
Охват и читатели10K

В этой заметке я хочу разобрать несколько «парадоксов» в данных, о которых полезно знать как начинающему аналитику данных, так и любому человеку, кто не хочет быть введенным в заблуждение некорректными статистическими выводами.

За рассматриваемыми примерами не кроется сложной математики помимо базовых свойств выборки (таких, как среднее арифметическое и дисперсия), зато такие кейсы могут встретиться и на собеседовании, и в жизни.

Погнали!

Ближайшие события

Кризис в электронике приводит к удорожанию DDR5 — дешевой память не будет

Время на прочтение3 мин
Охват и читатели10K

Пару недель назад мы писали о том, что дефицит на рынке полупроводников может привести к более серьезным последствиям, чем ожидалось ранее. Например, поставки различных электронных устройств не будут расти, плюс повышаются цены буквально на все, что связано с электроникой, да что там — останавливаются целые заводы по производству как электронных устройств, так и автомобилей.

Повышение цен само по себе серьезная проблема. Например, постоянное удорожание исходных ресурсов, нехватка чипов памяти и т.п. приводит к увеличению стоимости новых элементов, включая DDR5. По мнению экспертов, новые планки памяти будут минимум на 50% дороже ОЗУ предыдущего поколения, то есть DDR4.
Читать дальше →

Дефицит полупроводников усиливается: Samsung так и не возобновил работу на фабрике в Техасе

Время на прочтение4 мин
Охват и читатели17K

Как гласит народная пословица, беда не приходит одна, она и детей с собой приводит. Часто так получается не только в жизни, но и в бизнесе, производстве: происходит одно плохое событие, за которым следуют другие — чаще всего из-за негативных внешних факторов.

Но хватит лирики. Как мы уже писали, в мире постепенно растет нехватка полупроводниковых чипов. Эксперты оценивают объем дефицита в 10-30%. Любой дополнительный негативный фактор может усилить нехватку компонентов, что, конечно же, влияет на все прочие отрасли — производство ноутбуков, десктопов, серверов, даже автомобилей. И вот он проявился: корпорация Samsung до сих пор не возобновила производство полупроводников на своей американской фабрике в Техасе.
Читать дальше →

Хабрарейтинг 2020: Лучшие корпоративные блоги

Время на прочтение7 мин
Охват и читатели7.4K
Привет, Хабр.

Это завершающая, третья часть неофициального рейтинга лучших статей Хабра 2020 года. В этот раз мы рассмотрим корпоративные блоги. Различными компаниями на Хабре было опубликовано около 9000 статей, и разумеется, среди них можно найти немало интересного.

Продолжение под катом.
Читать дальше →

Пожалуйста, прочтите: на что Википедия тратит деньги. Отчёт 2008/2009

Время на прочтение2 мин
Охват и читатели2.2K

Отчёт некоммерческой организации «Фонд Викимедиа» за потраченные деньги и произошедшие события


Мне кажется, что уважаемое Хабрасообщество ещё не видело этого отчёта, хотя раньше при обсуждении любой темы, связанной с Википедией постоянно возникали вопросы финансового характера. Красочный и красиво оформленный ежегодный отчёт «Фонда Викимедиа» ответит на регулярные вопросы вроде «Зачем Википедии столько денег?». Его обязательно должны прочитать все, у кого возникают такие вопросы!

Также внутри упаковки информация о:

Внимание: В отчёте не будет ответа на вопрос когда же наконец Википедия повесит рекламу от Google, зато читатели узнают, что 12% собранных денег тратится на… сбор денег. =))

Страница с этим и предыдущими годовыми отчётами

Скачать отчёт за 2008-2009 год (PDF, 2.0 MB)

Пролистать PDF-доклад в браузере

Примечание: Сервера 6-го по популярности сайта в мире не боятся хабраэффекта, только вандалов. =))

Под катом пост из блога WMF и несколько скриншотов из отчёта.

UPD: В комментариях предложили перевести на русский язык. Давайте поможем друг другу!

Читать дальше →

Доля Linux на десктопах достигла 3%? Возможно, гораздо больше. Всё зависит от того, как считать

Время на прочтение4 мин
Охват и читатели16K

Несколько дней назад появилась информация о том, что доля Linux на десктопах превысила 3%. Данные предоставлены Statcounter, так что они вполне надёжные, хотя, конечно, погрешности тоже могут быть. Как бы там ни было, но 3% Linux получил впервые за 30 лет существования, так что впереди 4%, 5% и более процентов рынка десктопных ОС. Хотя, возможно, доля Linux уже превысила 7% — здесь всё зависит от того, как считать. Подробности — под катом.

Читать далее

Хабрамегарейтинг: лучшие статьи и статистика Хабра за 12 лет. Часть 2/2

Время на прочтение13 мин
Охват и читатели18K
Привет, Хабр.

В первой части были рассмотрены некоторые закономерности развития такого интересного ресурса, как habrahabr. Материал получился длинный, так что продолжение здесь. В этой части мы заодно посмотрим как строить такие картинки, и наконец, завершим нашу статистику и рейтинг.



Кому интересны результаты, прошу под кат.
Читать дальше →