Визуализация данных *

Облекаем данные в красивую оболочку

СтатьиПостыНовостиАвторыКомпании

S0mbre 27 янв 2022 в 01:24

Преступность в США и России: сравнительный обзор

11 мин

145K

ИнфографикаВизуализация данных*Открытые данные*Python*

В предыдущем цикле статей я начал рассматривать открытые данные по преступности в США в разных контекстах (связь с расовой принадлежностью, преступления на почве нетерпимости, нападения на полицейских). Мне стало интересно сравнить преступность в США с ситуацией в нашей стране, благо эти данные тоже легко найти. Получилось познавательно. Интересно?

🎩🚬🔫 Да

+128

466

Bright_Translate 11 окт 2024 в 13:01

Учимся читать QR-коды без компьютера

Средний

4 мин

54K

Блог компании RUVDS.comАлгоритмы*Визуализация данных*Интерфейсы*

Туториал

Перевод

Задавались ли вы когда-нибудь вопросом, как работают QR-коды? Если да, то эта статья для вас. Здесь вас ждёт интерактивное объяснение*, которое мы составили для семинара, проводившегося в рамках Всемирного конгресса хакеров 37C3, но вы также можете использовать его самостоятельно.

Прочитав статью, вы узнаете:

Из чего состоят QR-коды.
Как декодировать QR-коды вручную (используя нашу шпаргалку).

Читать дальше →

+126

qbertych 7 мая 2024 в 17:09

День Радио: смотрим видео на радиоспектре через SDR

5 мин

14K

Привет, Хабр! На дворе День радио, а значит у нас есть отличный повод сделать что-нибудь интересное. На днях мой взгляд упал на пылившийся в углу SDR-приемник, и тут понеслось.

Читать дальше →

+125

R3EQ 3 авг 2022 в 05:24

Исследование и анализ содержимого неизвестной карты памяти

10 мин

31K

Восстановление данных*Визуализация данных*Реверс-инжиниринг*Хранение данных*Накопители

Недавно мой один знакомый подарил мне старую SD карту памяти фирмы «Canon» на 128 МБ, которую нашёл где-то на улице. Её вполне мог кто-нибудь просто выкинуть, так как обычному пользователю ей очень сложно найти применение в современных технических условиях. Объём 128 МБ по нынешним временам считается очень малым, да и в смартфон её не вставишь ввиду большого размера. В основном распространены карты памяти microSD, которые вставляются в большинство смартфонов, но были также ещё и miniSD. Карты памяти малого объёма (MMC 8 МБ, 16 МБ) я встречал лет 20 назад в miniDV видеокамерах. Они там использовалась в качестве дополнительного носителя для сохранения фотографий.

+121

pvdubinin 26 сен 2023 в 08:00

BI-инструмент от Яндекса DataLens — теперь в опенсорсе

7 мин

65K

Блог компании Yandex Cloud & Yandex InfrastructureБлог компании ЯндексВизуализация данных*Open source*

✏️ Технотекст 2023

Сегодня мы опубликовали на GitHub под открытой лицензией Apache 2.0 исходный код Yandex DataLens — сервиса для анализа и визуализации данных. Теперь использовать опенсорс-версию DataLens может любой желающий и в любой инфраструктуре.

Меня зовут Павел Дубинин, вместе с Гаджи Гаджиевым мы в Yandex Cloud занимаемся развитием DataLens. Сегодня расскажем, какие задачи он помогает решать разным пользователям, какие возможности открываются с выходом в опенсорс и что можно развернуть у себя прямо сейчас.

+112

eleweek 16 июн 2021 в 18:29

Как я пытался придумать новый подход к изучению алгоритмов через интерактивные визуализации

4 мин

28K

Python*Программирование*Алгоритмы*Визуализация данных*Учебный процесс в IT

Представьте человека, который изучает алгоритмы. Чтобы понять как они работают, приходится разбираться в их коде и представлять, как компьютер будет его выполнять. Это странно — почему мы должны учиться думать как компьютер, вместо того, чтобы заставить его помогать нам? Какая-то сильная технозависимость.

На мой взгляд, потеть должна машина, а человек учиться, не выворачивая мозги наизнанку. Поэтому я подумал, а почему бы не визуализировать работу алгоритмов? Визуализации помогли бы не закапываться в код, а наглядно показали бы как работают алгоритмы и позволили бы понять их. Что у меня получилось — читайте в этой статье.

+107

analyticsgroup_ru 15 мар 2019 в 06:56

Аналитика девушек с низкой социальной ответственностью (Заряжено Power BI, Qlik Sense, Tableau)

6 мин

126K

Исследования и прогнозы в IT*Визуализация данных*Data Mining*Brainfuck*Big Data*

Из песочницы

Кто мы такие и какие были предпосылки проекта?

Добрый день, меня зовут Лазарев Владимир, я руководитель BI-интегратора Аналитикс Групп. Мы делаем для бизнеса наглядные отчёты по маркетингу, продажам, финансам, логистике на базе ведущих аналитических платформ Qlik Sense, Power BI, Tableau.

В BI платформах очень важна визуальная составляющая. Если вы посмотрели десятки демо-отчетов BI-систем и вам не нравится как выглядит та или иная платформа, то скорее всего вы ее не будете внедрять, даже если вас устраивает цена и технические характеристики. Исходя из этого рождается необходимость увидеть одни и те же данные в разных аналитических платформах, чтобы можно было сопоставить.

И желательно, чтобы данные были интересными… :-)

Откуда появилась идея сделать этот отчёт?

Несколько лет назад Высшая школа экономики опубликовала статью о формировании цен на услуги девушек низкой социальной ответственности в Москве. Это были агрегированные данные анализа 1.800 анкет. Нам показались интересными данные, которые стоят за этими выводами социологов ВШЭ. И мы решили проработать эту тематику.

Читать дальше →

+107

165

dlinyj 14 апр 2014 в 16:16

Гармонические колебания

10 мин

277K

Математика*Визуализация данных*

На хабре было несколько статей по преобразованию Фурье и о всяких красивостях типа Цифровой Обработки Сигналов (ЦОС), но неискушённому пользователю совершенно не понятно, зачем всё это нужно и где, а главное как это применить.

АЧХ шума.

Лично мне после прочтения этих статей (например, этой ) не стало понятно, что это и зачем оно нужно в реальной жизни, хотя было интересно и красиво.
Хочется не просто поглядеть красивые картинки, а так сказать, ощутить нутром, что и как работает. И я приведу конкретный пример с генерацией и обработкой звуковых файлов. Можно будет и послушать звук, и поглядеть его спектр, и понять, почему это так.
Статья не будет интересна тем, кто владеет теорией функций комплексной переменной, ЦОС и прочими страшными темами. Она скорее для любопытствующих, школьников, студентов и им сочувствующих :).

Читать дальше →

+106

DmitrySpb79 15 дек 2019 в 13:45

Хабрарейтинг 2019: статистика и рейтинг авторов за 2019 год

7 мин

13K

Статистика в ITСоциальные сети и сообществаПрограммирование*Визуализация данных*Веб-аналитика*

Привет Хабр.

В первой части была рассмотрена некоторая статистика и опубликован рейтинг статей этого сайта. Во второй части будут рассмотрены другие статистические закономерности этого года, которые мне показались интересными, а также будет опубликован рейтинг авторов за этот, 2019 год.

Первая часть рассчитана на читателей сайта, эта будет более интересна авторам, но и остальные надеюсь, найдут что-нибудь полезное — статьи авторов, попавших в рейтинг, определенно имеет смысл прочитать.

Продолжение под катом.

Читать дальше →

+104

VladFX 18 авг 2020 в 05:35

Аномалии голосования по поправкам к Конституции России. Часть 2

13 мин

29K

Big Data*Data Mining*Визуализация данных*Открытые данные*

Сcылка на первую часть

Основная цель второй части — это детально исследовать феномен массового рисования (выдумывания) результатов голосования на конкретных примерах.

Как и в первой части, все вычисления, визуализации и парсинг данных приведены в Google Colab, который доступен по этой ссылке Google Colab.

Читать дальше →

+101

263

DmitrySpb79 19 дек 2020 в 13:50

Хабрарейтинг 2020: статистика и рейтинг лучших статей за 2020 год

9 мин

29K

Привет, Хабр.

Заканчивается 2020 год, а значит, настало время подвести статистические итоги и составить уже традиционный рейтинг лучших статей Хабра за этот год. Этот рейтинг не является официальным, данные собираются парсером с помощью Python. Сортируя данные по тем или иным параметрам, можно получать разные выборки, что на мой взгляд, даёт довольно неплохие результаты. Для читателей также может быть интересно перечитать какие-то статьи, которые они пропустили в течении года.

Поехали.

Читать дальше →

+95

Superzoos 14 фев в 12:16

PAL видеоадаптер на FPGA с буфером кадра

Средний

18 мин

6.6K

FPGA*Программирование*ВидеотехникаВизуализация данных*Java*

Из песочницы

Наверное, каждый второй разработчик на ПЛИС в начале своего пути пытался визуализировать работу своих схем. Кто-то подключал TFT-дисплей, кто-то — VGA монитор. А у меня под рукой оказался только телевизор с композитным входом. Ну что ж, работаем с тем, что есть!

+93

Spiralhead 5 дек 2023 в 07:01

Как мы научили заводчан строить красивые инженерные отчеты из Jupyter Notebook на Python

14 мин

31K

Блог компании ГК ЛАНИТPython*Программирование*Визуализация данных*Подготовка технической документации*

Была у нас тут история, когда легкий перфекционизм помог привести в порядок конструкторскую документацию и регулярно экономить инженерам кучу дней на прохождение бюрократических процедур. В ее основе – создание системы управления расчетными данными и переход от трудночитаемых и трудноинтегрируемых отчетов Mathcad к гибкой связке Jupyter Notebook с Python и Teamcenter. Но основной рассказ будет про то, как преобразовывать и экспортировать математические формулы, таблицы и другие элементы из Jupyter в красивый и удобный вид.

+93

escoman 28 янв 2020 в 14:45

Анализ половозрастной пирамиды России с 1946 по 2036 гг

3 мин

65K

Визуализация данных*ИнфографикаНаучно-популярноеСтатистика в IT

Из песочницы

Как изменилась структура российского (постсоветского) общества с середины XX века. Спойлер: она изменилась кардинально.

Поделиться моими исследованиями половозрастной пирамиды России с общественностью посоветовали мои знакомые и друзья. Некоторые из них утверждают, что в исследованиях есть научная ценность. Хотя я не демограф, а просто любопытный программист.

Читать дальше →

+93

350

iggisv9t 4 сен 2019 в 11:04

Визуализация больших графов для самых маленьких

12 мин

60K

Блог компании Open Data ScienceData Mining*Визуализация данных*Искусственный интеллектМашинное обучение*

Что делать, если вам нужно нарисовать граф, но попавшиеся под руку инструменты рисуют какой-то комок волос или вовсе пожирают всю оперативную память и вешают систему? За последние пару лет работы с большими графами (сотни миллионов вершин и рёбер) я испробовал много инструментов и подходов, и почти не находил достойных обзоров. Поэтому теперь пишу такой обзор сам.

Читать дальше →

+93

alexanderkuk 22 ноя 2015 в 14:28

Анализ резюме с HeadHunter. Кто сколько зарабатывает и в каких отраслях работает

11 мин

99K

Big Data*Data Mining*Визуализация данных*

Недавно, на хакатоне от Petamelon нам в руки попал датасет с ~6 000 000 резюме с НН. Там, естественно, не было никаких персональных данных и контактов, но было много других интересных вещей: ожидаемая зарплата, возраст, пол, примерный адрес, образование и индустрии, в которых человек ищет работу. Было решено попробовать использовать эти данные в нашем проекте про выбор школ. Идея заключалась в том, чтобы определить в каких индустриях работают выпускники школ и сколько примерно зарабатывают. Но я, конечно, не удержался и построил кучу других бесполезных, но прикольных таблиц и графиков.

Распределение резюме по возрасту имеет интересную форму и как будто разделено на две части: до окончания института и после:

В Москве с возрастом ожидаемая зарплата выходит на плато в ~50 000 рублей:

Читать дальше →

+93

ru_vds 27 ноя 2023 в 13:00

Искусство создания понятных графиков

Средний

7 мин

25K

Блог компании RUVDS.comВизуализация данных*Графический дизайн*Программирование*

Туториал

Перевод

Эта статья — субъективное эссе о хороших и плохих практиках в визуализации данных, в нём приведены примеры и объяснения.

В папке Scripts/ на Github есть файлы .Rmd, генерирующие показанные ниже графики. Для их работы требуются R, RStudio и пакет rmarkdown.

R: Скачать R
RStudio: скачать RStudio
rmarkdown можно установить при помощи интерфейса установки пакетов в RStudio

Читать дальше →

+91

tyomitch 16 июн 2020 в 17:04

Сколько инструкций процессора использует компилятор?

3 мин

35K

Assembler*Визуализация данных*Компиляторы*ПроцессорыСтатистика в IT

Месяц назад я попытался сосчитать, сколько разных инструкций поддерживается современными процессорами, и насчитал 945 в Ice Lake. Комментаторы затронули интересный вопрос: какая часть всего этого разнообразия реально используется компиляторами? Например, некто Pepijn de Vos в 2016 подсчитал, сколько разных инструкций задействовано в бинарниках у него в /usr/bin, и насчитал 411 — т.е. примерно треть всех инструкций x86_64, существовавших на тот момент, не использовались ни в одной из стандартных программ в его ОС. Другая любопытная его находка — что код для x86_64 на треть состоит из инструкций mov. (В общем-то известно, что одних инструкций mov достаточно, чтобы написать любую программу.)

Я решил развить исследование de Vos, взяв в качестве «эталонного кода» компилятор LLVM/Clang. У него сразу несколько преимуществ перед содержимым /usr/bin неназванной версии неназванной ОС:

С ним удобно работать: это один огромный бинарник, по размеру сопоставимый со всем содержимым /usr/bin среднестатистического линукса;
Он позволяет сравнить разные ISA: на releases.llvm.org/download.html доступны официальные бинарники для x86, ARM, SPARC, MIPS и PowerPC;
Он позволяет отследить исторические тренды: официальные бинарники доступны для всех релизов начиная с 2003;
Наконец, в исследовании компиляторов логично использовать компилятор и в качестве подопытного объекта :-)

Начну со статистики по мартовскому релизу LLVM 10.0:

ISA	Размер бинарника	Размер секции .text	Общее число инструкций	Число разных инструкций
AArch64	97 МБ	74 МБ	13,814,975	195
ARMv7A	101 МБ	80 МБ	15,621,010	308
i386	106 МБ	88 МБ	20,138,657	122
PowerPC64LE	108 МБ	89 МБ	17,208,502	288
SPARCv9	129 МБ	105 МБ	19,993,362	122
x86_64	107 МБ	87 МБ	15,281,299	203

В прошлом топике комментаторы упомянули, что самый компактный код у них получается для SPARC. Здесь же видим, что бинарник для AArch64 оказывается на треть меньше что по размеру, что по общему числу инструкций.

А вот распределение по числу инструкций:

Читать дальше →

+91

226

PatientZero 20 окт 2017 в 08:04

Структура и случайность простых чисел

22 мин

40K

Визуализация данных*Математика*

Перевод

Разбросаны ли простые числа по числовой оси подобно рассеянным ветром семенам? Разумеется нет: простота — это не вопрос случайности, а результат элементарной арифметики. Число является простым тогда и только тогда, когда ни одно меньшее положительное целое число кроме единицы не делит его нацело.

Но на этом история не заканчивается. Распределение простых чисел выглядит случайным, с неравномерными разрывами и скоплениями, которые выглядят довольно хаотично. Если и существует какая-то схема, то она непостижима. На самом деле, простые числа выглядят достаточно случайными, чтобы можно было сыграть с ними в кости. Создайте список последовательных простых чисел (допустим, начав с 11, 13, 17, 19,... ) и разделите их по модулю 7. Другими словами, разделите каждое простое число на 7 и сохраните только остаток. Результатом будет последовательность целых чисел из множества {1, 2, 3, 4, 5, 6}, которая выглядит почти как результат нескольких бросков правильной кости.

$\begin{align*} 11 \bmod 7 & \rightarrow 4 \qquad 47 \bmod 7 \rightarrow 5 \\ 13 \bmod 7 & \rightarrow 6 \qquad 53 \bmod 7 \rightarrow 4 \\ 17 \bmod 7 & \rightarrow 3 \qquad 59 \bmod 7 \rightarrow 3 \\ 19 \bmod 7 & \rightarrow 5 \qquad 61 \bmod 7 \rightarrow 5 \\ 23 \bmod 7 & \rightarrow 2 \qquad 67 \bmod 7 \rightarrow 4 \\ 29 \bmod 7 & \rightarrow 1 \qquad 71 \bmod 7 \rightarrow 1 \\ 31 \bmod 7 & \rightarrow 3 \qquad 73 \bmod 7 \rightarrow 3 \\ 37 \bmod 7 & \rightarrow 2 \qquad 79 \bmod 7 \rightarrow 2 \\ 41 \bmod 7 & \rightarrow 6 \qquad 83 \bmod 7 \rightarrow 6 \\ 43 \bmod 7 & \rightarrow 1 \qquad 89 \bmod 7 \rightarrow 5 \\ \end{align*}$

Читать дальше →

+91

infotanka 28 окт 2013 в 14:52

Лаборатория данных

2 мин

23K

Блог компании Лаборатория данныхВизуализация данных*

Сложные данные всегда были моей страстью. В 2007 году с подачи Артёма Горбунова я прочитала все книги Тафти и открыла для себя информационный дизайн. Первая визуализация — пассажиропотоки в метро — стала для меня счастливым билетиком в бюро, тогда же появился псевдоним Инфотанька. С тех пор я работала над тигриным календарём и бюрошными инфограммами, мобильным приложением «Веб-наблюдатель» со статистикой нарушений и информативным логотипом, умными маркетинговыми графиками для Зептолаба, интерфейсами Oh my stats!.

В июне этого года я, наконец, решила посвятить себя тому, что умею делать лучше всего, — визуализации данных. Так появилась лаборатория.

Читать дальше →

+90

3 4 ...

85 86

Визуализация данных *

Преступность в США и России: сравнительный обзор

Учимся читать QR-коды без компьютера

День Радио: смотрим видео на радиоспектре через SDR

Исследование и анализ содержимого неизвестной карты памяти

BI-инструмент от Яндекса DataLens — теперь в опенсорсе

Как я пытался придумать новый подход к изучению алгоритмов через интерактивные визуализации

Аналитика девушек с низкой социальной ответственностью (Заряжено Power BI, Qlik Sense, Tableau)

Кто мы такие и какие были предпосылки проекта?

Откуда появилась идея сделать этот отчёт?

Гармонические колебания

Хабрарейтинг 2019: статистика и рейтинг авторов за 2019 год

Аномалии голосования по поправкам к Конституции России. Часть 2

Хабрарейтинг 2020: статистика и рейтинг лучших статей за 2020 год

PAL видеоадаптер на FPGA с буфером кадра

Как мы научили заводчан строить красивые инженерные отчеты из Jupyter Notebook на Python

Ближайшие события

Анализ половозрастной пирамиды России с 1946 по 2036 гг

Визуализация больших графов для самых маленьких

Анализ резюме с HeadHunter. Кто сколько зарабатывает и в каких отраслях работает

Искусство создания понятных графиков

Сколько инструкций процессора использует компилятор?

Структура и случайность простых чисел

Лаборатория данных

Вклад авторов