Как стать автором
Обновить
108.37

Визуализация данных *

Облекаем данные в красивую оболочку

Сначала показывать
Порог рейтинга
Уровень сложности

Оцифровка звука FPGA платой MCY316

Уровень сложности Средний
Время на прочтение 6 мин
Количество просмотров 1.1K
image

Вот уже почти закончился сентябрь. Студенты уже давно вернулись за парты и учатся.
Многие начали изучать цифровую обработку сигналов. А как известно, лучше предмет пощупать один раз своими руками, чем десять раз прочитать о нём в учебнике.

В этой статье я расскажу о захвате звукового сигнала платой FPGA MCY316. Захват сигнала это только первый этап перед обработкой. Получим сигнал и передадим эти данные в ПК. Если всё получится, то в следующих работах добавим в ПЛИС цифровой фильтр
Читать дальше →
Всего голосов 19: ↑19 и ↓0 +19
Комментарии 2

Новости

BI-инструмент от Яндекса DataLens — теперь в опенсорсе

Время на прочтение 7 мин
Количество просмотров 15K

Сегодня мы опубликовали на GitHub под открытой лицензией Apache 2.0 исходный код Yandex DataLens — сервиса для анализа и визуализации данных. Теперь использовать опенсорс-версию DataLens может любой желающий и в любой инфраструктуре. 

Меня зовут Павел Дубинин, вместе с Гаджи Гаджиевым мы в Yandex Cloud занимаемся развитием DataLens. Сегодня расскажем, какие задачи он помогает решать разным пользователям, какие возможности открываются с выходом в опенсорс и что можно развернуть у себя прямо сейчас.   

Читать далее
Всего голосов 87: ↑87 и ↓0 +87
Комментарии 31

Сам себе BI-аналитик или как навести порядок в отчётности компании

Уровень сложности Простой
Время на прочтение 8 мин
Количество просмотров 4.6K

Привет, Хабр! На связи аналитики Кошелька. Наша команда состоит из 13 дата-аналитиков, 5 DE-инженеров, 2 ML-инженеров и ровно 0 BI-аналитиков. Что мы любим делать? Определять метрики и рисовать дашборды. Что нужно заказчику? Метрики и дашборды (а еще достижение целей и выручка, но не будем сейчас об этом).

В этой статье мы собрали инструкцию, как можно навести порядок в отчётности без отдельных BI-аналитиков, и с какими проблемами вы можете столкнуться в процессе.

Читать далее
Всего голосов 10: ↑10 и ↓0 +10
Комментарии 7

Сертифицируй ЭТО: как получить сертификат ФСТЭК на новейшую версию ПО

Уровень сложности Простой
Время на прочтение 6 мин
Количество просмотров 2.9K
Туториал

Привет! Сегодня наш разговор пойдет про сертификацию ФСТЭК и про тонкости этого процесса. Этот пост — не про теорию, а про практику, которая позволила нам получить одобрение ФСТЭК на версию 2.32 (на тот момент являлась новейшей - сейчас есть еще 2.33). Мы расскажем о том, что все это значит для пользователей нашей BI-платформы (из первых уст), а также почему мы уверены, что сертификация — это правильная практика не только “для бумажки”, но и для реальной пользы дела. Надеюсь, многое из этого текста окажется полезно как разработчикам российского ПО, так и его пользователям. Все подробности процесса нашей сертификации, в том числе мучительные — под катом!

Читать далее
Всего голосов 18: ↑17 и ↓1 +16
Комментарии 10

Истории

Разбираемся в отличии среднего чека от ARPU на примере одного интернет-магазина

Уровень сложности Средний
Время на прочтение 10 мин
Количество просмотров 1.8K

Ко мне обратился коллега с вопросами про бизнес-метрики – средний чек и ARPU.

В этой статье я разобрался в бизнес-метриках и ответил на вопросы:

- Что такое ARPU и средний чек? Как их рассчитывать? На какие вопросы они отвечают и для чего нужны? 

- Могут ли они ARPU и средний чек быть  равны между собой? Будут ли отличаться в динамике месяц от месяца?

- Что если в бизнесе кол-во продуктов фиксировано и все они с одинаковой ценой? Будет ли показатель от месяца к месяцу одинаков? А если рассчитывать среднюю выручку?

А для наглядности – рассчитал данные метрики на реальных данных интернет-магазина.

Читать далее
Всего голосов 7: ↑4 и ↓3 +1
Комментарии 8

Почему мой любимый API — это файл zip на сайте Европейского центрального банка

Уровень сложности Простой
Время на прочтение 7 мин
Количество просмотров 28K
Обзор
Перевод

Когда был максимальный курс доллара к евро?

Вот небольшая программа, вычисляющая это:

curl -s https://www.ecb.europa.eu/stats/eurofxref/eurofxref-hist.zip \ | gunzip \ | sqlite3 -csv ':memory:' '.import /dev/stdin stdin' \ "select Date from stdin order by USD asc limit 1;"

Результат: 2000-10-26. (Можете попробовать запустить её самостоятельно.)

Читать далее
Всего голосов 104: ↑90 и ↓14 +76
Комментарии 26

Логика и принципы построения BI-дашборда

Уровень сложности Простой
Время на прочтение 9 мин
Количество просмотров 4.1K
Туториал

Привет, Хабр!

Важная составляющая BI – это читаемый и понятный дашборд с визуальными элементами. Поэтому сегодня поговорим об общих принципах: этапах и логике построения, способах и инструментах для визуализации различных данных.

Статья будет полезна тем, кто только планирует начать применять BI в своей компании. Сложной технической информации тут не будет.

Читать далее
Всего голосов 9: ↑8 и ↓1 +7
Комментарии 6

Ad-hoc мониторинг: сбор, хранение и визуализация данных

Уровень сложности Средний
Время на прочтение 9 мин
Количество просмотров 1.3K

Готовим гибридную систему мониторинга + щепотка observability дабы нанести непоправимую пользу всему прогрессивному человечеству. С ароматом кофе, перед использованием можно добавить свои данные по вкусу.

Вход в картинную галерею
Всего голосов 3: ↑3 и ↓0 +3
Комментарии 0

Моделирование биологических явлений с помощью Python

Уровень сложности Средний
Время на прочтение 15 мин
Количество просмотров 2.3K
Мнение


Автор статьи: Артем Михайлов

Моделирование биологических явлений позволяет нам лучше понимать и прогнозировать поведение живых систем, начиная от популяционных динамик до молекулярных взаимодействий. Биологические явления нередко слишком сложны, чтобы быть полностью понятыми на интуитивном уровне, и моделирование предоставляет нам мощный инструмент для их анализа.

Моделирование биологических систем позволяет ученым исследовать разнообразные аспекты биологии, такие как динамику популяций, структуру генных сетей, взаимодействие молекул внутри клеток и многое другое. Это полезно не только в фундаментальных исследованиях, но и в практических областях, таких как медицина, сельское хозяйство и экология.
Читать дальше →
Всего голосов 14: ↑13 и ↓1 +12
Комментарии 1

DIY-маркетинг: как проанализировать спрос на рынке с помощью KeyCollector, Python и DataLens

Время на прочтение 4 мин
Количество просмотров 1.4K

Исследовать поисковый спрос — обычная задача для SEO-специалиста: просто собираешь запросы, смотришь сезонность и делаешь выводы. Но что если нужно исследовать целую сферу бизнеса типа авторынка, на котором представлено очень много брендов, а сроки и ресурсы ограничены? Включаем воображение и расширяем инструментарий. Делимся своим хитрым способом.

Я Женя Кузнецов, диджитал-стратег JetStyle. Мы исследуем китайский авторынок в РФ, и анализ поискового спроса — часть этой работы. Мы решили распарсить Вордстат за два года и собрать список всех брендов с интентами и сезонностью, а потом визуализировать в BI, чтобы увидеть наглядную динамику и тренды. Расскажу пошагово, как мы действовали.

Читать далее
Всего голосов 4: ↑4 и ↓0 +4
Комментарии 3

Занимательные картинки электоральной статистики на выборах в Государственную Думу 2021 года по 118 ОИК

Уровень сложности Простой
Время на прочтение 2 мин
Количество просмотров 4.3K

В первой и второй предыдущих статьях на данную тему мы рассматривали аномалии выборной статистики по 125 избирательному округу по партийным спискам на выборах в Государственную Думу 2021 года, теперь сместимся по Подмосковью северо-западнее и рассмотрим электоральные аномалии по результатов выборов по 118 одномандатному избирательному округу.

В связи с отсутствие нормальной возможности копировать первичные данные УИК с сайта ЦИК РФ, данные взяты из телеграм-канала t.me/RUElectionData.

Для начала Вашему вниманию итоги выборов по одномандатному округу.

Читать далее
Всего голосов 34: ↑33 и ↓1 +32
Комментарии 7

Анализ данных с использованием библиотеки Dask

Уровень сложности Средний
Время на прочтение 14 мин
Количество просмотров 1.5K
Туториал


Автор статьи: Артем Михайлов


Dask — это мощная библиотека для параллельных и распределенных вычислений в Python, предназначенная для работы с большими объемами данных. Она разработана с учетом того, чтобы предоставить инструменты для высокоуровневого управления вычислениями, которые могут быть выполнены параллельно или распределенно на нескольких вычислительных узлах. Основной целью Dask является упрощение обработки данных, которые не помещаются в оперативной памяти одного компьютера.

Dask может использоваться для выполнения разнообразных задач, включая анализ данных, обработку изображений, машинное обучение, и многое другое. Его фундаментальной концепцией является создание графа задач, который описывает вычисления и зависимости между ними. Затем этот граф может быть выполнен параллельно или распределенно.
Читать дальше →
Всего голосов 10: ↑10 и ↓0 +10
Комментарии 0

Аномалии электоральной статистики на выборах в Государственную Думу 2021 года по 125 ОИК, КОИБ or not КОИБ

Уровень сложности Простой
Время на прочтение 3 мин
Количество просмотров 7.5K

В статье 2021 года мы пронаблюдали аномалии результатам выборов в Государственную думы 2021 года подмосковному 125 избирательному округу. На некоторых избирательных участках прослеживались аномалии явки, аномалии темпа голосования в последние часы выборов, причем часто эти аномалии коррелировали с очень хорошими результатами партии Единая Россия.

Недавно в телеграмм канале общественного деятеля Бориса Надеждина был опубликован перечень подмосковных избирательных участков оборудованных Комплексом обрабо́тки избирательных бюллетеней (КОИБ). В связи с появлением новых исходных данных возникло желание сравнить результаты выборов 2021 на участках, оборудованных КОИБ и не оборудованных.

Вот что получилось.

Читать далее
Всего голосов 38: ↑35 и ↓3 +32
Комментарии 35

Ближайшие события

Битва пет-проектов
Дата 25 сентября – 30 ноября
Место Онлайн
Business&IT Day: Retail CPG
Дата 28 сентября
Время 09:50 – 14:00
Место Онлайн
XIX конференция разработчиков свободных программ «Базальт СПО»
Дата 29 сентября – 1 октября
Время 10:00 – 19:00
Место Переславль-Залесский Онлайн
Kokoc Hackathon
Дата 29 сентября – 1 октября
Время 19:00 – 21:00
Место Онлайн
Ruby Russia 2023 Online
Дата 30 сентября
Время 11:00 – 21:00
Место Онлайн
PG Boot Camp Russia 2023
Дата 5 октября
Время 10:00 – 17:00
Место Москва Онлайн
Joker
Дата 9 – 14 октября
Время 16:00 – 19:30
Место Санкт-Петербург Онлайн
Питч-сессия pravo (tech) impulse
Дата 19 октября
Время 15:45 – 17:30
Место Москва
Russia Risk Conference 2023 — 19-я конференция по риск-менеджменту
Дата 25 – 26 октября
Время 10:00 – 19:00
Место Москва Онлайн
Онлайн IT HR-конференция HR42
Дата 17 – 18 ноября
Время 10:00 – 14:00
Место Онлайн
HighLoad++ 2023
Дата 27 – 28 ноября
Время 9:00 – 20:00
Место Москва Онлайн

Анализ и визуализация данных с помощью библиотеки Altair

Уровень сложности Простой
Время на прочтение 14 мин
Количество просмотров 2.3K
Обзор


Автор статьи: Артем Михайлов

Altair — это декларативная библиотека визуализации данных, разработанная на основе языка Vega и Vega-Lite. Она предоставляет высокоуровневый интерфейс для создания информативных и красочных графиков с минимальными усилиями. Основная философия Altair заключается в том, что пользователи должны описывать, что они хотят увидеть на графике, а не как это реализовать. Это делает код более читаемым и интуитивно понятным.
Читать дальше →
Всего голосов 10: ↑9 и ↓1 +8
Комментарии 2

Покупаем BI: как сформировать оптимальный пакет и сэкономить до 86 млн рублей

Уровень сложности Простой
Время на прочтение 8 мин
Количество просмотров 915

Покупка BI-решения для компании всегда была дорогостоящим предприятием, занимающим уйму времени у всех департаментов. А с момента ухода иностранных поставщиков с рынка России, когда особенно остро встал вопрос перехода на отечественные аналоги, этот процесс еще больше осложнился. Компании стали урезать затраты на новые проекты, а цены на отечественные BI-решения повысились.  

В данной статье я расскажу о том, каких затрат стоит ожидать компаниям при развертывании BI-инструментов, а также представлю разработанное нами альтернативное решение, которое поможет сократить затраты на владение BI и упростить процесс доставки отчетов сотрудникам. 

Читать статью
Всего голосов 5: ↑3 и ↓2 +1
Комментарии 0

Разбор I2S трафика в программе Logic 2

Уровень сложности Простой
Время на прочтение 1 мин
Количество просмотров 1.5K
Туториал

В этом тексте я написал инструкцию того как настроить логический анализатор Saleae производить автоматический синтаксический разбор трафика на шине I2S.

Читать далее
Всего голосов 6: ↑4 и ↓2 +2
Комментарии 23

Архитектура аналитической платформы Modus ч.2: BI

Уровень сложности Средний
Время на прочтение 7 мин
Количество просмотров 768
Обзор

Привет, Хабр!

На связи Саша Чебанов, product owner компании Modus. Сегодня хочу поделиться второй статьей из цикла «Архитектура аналитической платформы». Поговорим об общем устройстве BI-системы и подробнее остановимся на анатомии Modus BI. Вы узнаете, из каких компонентов состоит аналитическая BI-система, какие данные ей нужны, откуда она их берет и как они превращаются в графики и диаграммы. Поехали!

Читать далее
Всего голосов 1: ↑1 и ↓0 +1
Комментарии 4

Шпаргалка по Seaborn. Делаем матрицы красивыми

Уровень сложности Простой
Время на прочтение 8 мин
Количество просмотров 3.9K
Туториал

Привет, Хабр!

Часто в работе аналитика данных при подготовке очередного отчета или презентации, колоссальное количество времени уходит именно на графическую составляющую подготовки.

Ведь все хотят сделать отчет не только информативным, но и визуально привлекательным.

В этой статье мы разберем основные шаги, которые помогут сделать ваши матрицы стильными и продающими ваши результаты, используя лишь две основные библиотеки визуализации в Python - Seaborn и Matplotlib.

Читать далее
Всего голосов 11: ↑10 и ↓1 +9
Комментарии 0

Путь 11 страданий: это не ДЗЕН и не ДАО — это выбор российского BI

Уровень сложности Средний
Время на прочтение 8 мин
Количество просмотров 5.3K

Привет, Хабр! Мне, наконец, есть чем поделиться с вами. И это результаты практически годового процесса выбора BI-системы из числа российских разработок на замену одной из западных платформ. За это время мне стало очевидно, что примерно 50% действий, которые мы сделали, можно было и не делать, а 20% не стоило делать вовсе. В итоге получилась практически инструкция “как не надо” выбирать себе BI-систему, если вы хотите, чтобы она действительно начала приносить вам пользу ASAP. Под катом — также мои мысли о том, как надо было бы. Желающих обсудить, прошу присоединяться.

Хочу научиться на чужих ошибках...
Всего голосов 29: ↑27 и ↓2 +25
Комментарии 23

Система визуализации и мониторинга. Grafana + Prometheus

Уровень сложности Простой
Время на прочтение 5 мин
Количество просмотров 8.6K
Туториал

Немного расскажу про установку Grafana на windows и настройку базовых метрик систем.

Пару слов о самой Grafana и для чего она нужна.

Grafana – это платформа для мониторинга, анализа данных и визуализации собранных данных с открытым исходным кодом. По сути она используется для визуального представления собранных метрик для более комфортного слежения за состоянием системы.

В данной статье буду использовать:

Читать далее
Всего голосов 9: ↑9 и ↓0 +9
Комментарии 11

Вклад авторов