Как стать автором
Поиск
Написать публикацию
Обновить
42.58

Визуализация данных *

Облекаем данные в красивую оболочку

Сначала показывать
Порог рейтинга
Уровень сложности

Спринт с Visiology: 10 дней от подготовки данных до дашборда

Уровень сложностиПростой
Время на прочтение2 мин
Количество просмотров1K

Привет, друзья! На следующей неделе, 15 мая, мы начинаем спринт-интенсив по работе с платформой Visiology. За 10 дней я планирую показать и рассказать все основное о платформе. Если вы задумывались о знакомстве с Visiology или в вашей компании как раз рассматривают варианты перехода на российский BI, новый спринт — отличная возможность составить представление и уже получить первичную экспертизу по платформе. Все подробности — под катом.

Хочу сделать свой дашборд!

Как мы подружили HR с Process Intelligence

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров1.3K

Всем привет! Меня зовут Наталия Стекунова, руковожу отделом по управлению персоналом в GlowByte. Расскажу о том, как и зачем мы в компании применили технологии Process Intelligence в процессе подбора персонала. 

Читать далее

Искусственный интеллект и странные аттракторы

Уровень сложностиСредний
Время на прочтение10 мин
Количество просмотров11K
Нехаотический странный аттрактор

Я уже довольно немолодой человек с консервативными взглядами на развитие новых технологий. Все, что связано с Искусственным Интеллектом, никогда не занимало меня настолько, чтобы уделять ему достаточно много времени или хотя бы следить за последними новостями в этой области. Однако с неделю назад искусственный интеллект сам меня нашел и предложил свои услуги. Сидел я себе в Скайпе, общался по работе, и вдруг в моём списке чатов появился новый чат с пользователем Bing и новое сообщение в нём:

Bing 13:21
Привет, это Bing! Я здесь, чтобы помочь вам. (smileeyes)
Читать дальше →

Мигрируем с Qlik: как создать надежное хранилище для ваших данных

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров3.7K

Последние 12 месяцев много обсуждается тема миграции с ИТ‑систем, которые оказались недоступны в России. Во всех компонентах ИТ‑инфраструктуры появились критические зоны, которые раньше закрывались международными продуктами и которые нужно срочно переводить на работающие платформы. Не исключением стала и область бизнес‑аналитики. Иностранные BI‑системы ушли с российского рынка и компании начали интересоваться, на что можно перенести свою аналитическую отчетность.

Меня зовут Александр Гончар и работаю в консалтинговой компании A2 Consulting и для нас тема миграции с зарубежных BI‑решений не является новой. За последние пять лет мы реализовали десяток проектов, в которых осуществляли миграцию из аналитических платформ в другие решения, прежде всего, в части хранилищ данных (ХД). Расскажу сегодня об опыте миграции с такого известного BI‑инструмента, как Qlik.

Зачем мигрировать с Qlik?

Актуальность миграции данных с платформ QlikView и Qlik Sense, в которых основные данные хранятся в файловом хранилище в виде QVD‑файлов, а весь ETL выполняется средствами Qlik, сохранялась из‑за нескольких факторов.

Первая причина — желание заказчиков глубже анализировать клиентские данные и пользоваться преимуществами предиктивной аналитики. Параллельно, у компаний из других отраслей существовало несколько систем бизнес‑аналитики, и им хотелось пользоваться данными из единого источника.

Читать далее

Мнение об интенсивах Академии Яндекса + выпускной проект

Уровень сложностиПростой
Время на прочтение11 мин
Количество просмотров10K

Всем привет! Я выпускник данной Академии и победитель в конкурсе проектов. Я получил уникальный опыт, который будет полезен начинающим специалистам

Этот обзор подойдет в первую очередь тем, кто еще учится в вузе или школе, а также тем у кого есть дети данного возраста - Интенсивы рассчитаны на молодых людей до 19 лет.

Предвкушаю вопросы, поэтому я сразу говорю - обзор не реклама. Не путайте Практикум и Академию, академия - некоммерческая организация, а интенсивы - бесплатные курсы, которые (внезапно) просто дают знания.

Минусы и результаты собеседований после курсов - перед началом секции "проект" - эти 3 модуля покажут реальный уровень выпускников академии. Все что будет дальше является сугубо личным мнением. Приступим!

Узнать больше о курсах...

Анализ временных рядов

Уровень сложностиПростой
Время на прочтение8 мин
Количество просмотров75K

Привет! В последние годы аналитика данных переживает настоящий бум. Все большее количество компаний принимают решение сбора, хранения и анализа данных, чтобы повысить эффективность своих бизнес-процессов и принимать решения на основе фактов.

Одним из наиболее важных инструментов в аналитике данных является анализ временных рядов. Временной ряд - это последовательность наблюдений за определенным параметром в разные моменты времени. Таким образом, временной ряд содержит информацию о том, как изменяется параметр со временем.

Читать далее

Ещё один взгляд компьютерным зрением на работу коммунальных служб

Время на прочтение3 мин
Количество просмотров2.1K

В прошлой статье Взгляд компьютерным зрением на работу коммунальных служб удалось выявить некоторые закономерности в передвижении пешеходов в зависимости от состояния тротуаров в зимний период. Сейчас снег растаял, лужи высохли, и наконец можно запустить алгоритмы аналитики на идеальных данных — видео с уличных камер в сухой солнечный весенний день. Эта статья будет значительно короче, в ней просто сравним результаты с идеальными условиями и добавим еще одну метрику — прямолинейность движения.

Читать далее

Как рассчитать скидку за первый и последний этаж почти без формул в Excel

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров4.6K

В продолжение рассказов о Big Data для простых смертных предлагаем попробовать себя в решении жилищного вопроса: как отличаются цены за квадратный метр на разных этажах. Житейская польза от этой заметки заключается в получении без особых усилий и без специальных навыков достоверных знаний об ожиданиях на рынке недвижимости. Государство скрывает цены реальных сделок, но иметь адекватное представление о настроениях продавцов можно и без знакомого опытного риелтора, сына маминой подруги.

Статья представляет собой пошаговую иллюстрированную инструкцию по решению задачи анализа этажности городской застройки, в т.ч. расчет скидок за первый и последний этажи. В качестве модельного города принят Брянск. Расчетный файл прилагается и его листы пронумерованы в последовательности выполненных операций. Шаблон расчета легко адаптировать для другого города и вида недвижимости.

Изложенный подход призван аргументировать представление о том, что Big Data не является прерогативой дата сатанистов, но в известной степени доступен неспециалистам. Материал может быть интересен всем, кроме работающих с данными профессионально. Приведенные приемы будут востребованы в работе с данными для риелторов и оценщиков без навыков программирования. Технохардкор в данном случае заключается не в инсайтах применения фреймворков типа MapReduce, а в реализации всего пайплайна средствами общеизвестного офисного приложения.

Инструкция состоит из двух частей. В первой части изложен порядок подготовки, первичного ознакомления с данными и уточнения цели исследования. Во второй части будет сделан расчет скидки за этаж.

Читать далее

Как дать крылья своей сводной таблице в Apache Superset

Уровень сложностиСредний
Время на прочтение6 мин
Количество просмотров10K

Эта статья посвящена особенностям доработок в Apache Superset, и в ней я расскажу, как его можно использовать для визуализации больших объемов данных в рамках сводных таблиц.

Хочу читать дальше

Мой поиск аналога Microsoft Visio

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров82K

Доброго дня всем.

В сегодняшней статье хотел бы поделиться проведенным анализом приложений, потенциально способных заменить MS Visio для разного рода задач.

Читать далее

Простая Enterprise Architecture. Автопостроение схемы архитектуры по данным репозитария

Уровень сложностиСредний
Время на прочтение9 мин
Количество просмотров5.8K

Предполагается, что имеется репозитарий (repository, хранилище данных) корпоративной архитектуры, например, в виде файла excel или источника, связанного по ODBC.

Задача: на основе данных из репозитария, содержащего объекты архитектуры предприятия (процессы, орг-структура, активы и т.п.), автоматически построить схему архитектуры: сгенерировать дерево на основе данных об иерархии объектов. Рассмотрен инструментарий excel и visio (сторонних add-in), приведена сопутствующая критика этих Microsoft-инструментов.

Генерация структурных схем штатным мастером Орг-диаграмм visio по данным excel (ODBC) аналогична табличному csv или скриптовым языкам dot, mermaid, plantUML в инструментах graphviz и drawio, а также rdf-триплетам (linked data), визуализируемым через RDF grapher. Генерация штатным мастером ограничена древовидными структурами, но использование visio VBA позволяет устранить ограничение древовидности, «Но это уже совсем другая история».

В предыдущей статье Простая Enterprise Architecture. Архитектура компании садоводов было рассказано про само понятие «корпоративная архитектура» (что такое Enterprise Architecture, ЕА) и объект архитектуривания (корпорация садоводов, СНТ).

В том примере нужно было вручную рисовать архитектурные схемы (структурные и VAD – цепочка добавленной стоимости) и далее связывать данные excel c фигурами visio в ручном (путем перетаскивания строк из поля «Внешние данные») или в автоматическом (автоматическое связывание по ID) режиме. В этой статье обойдемся без ручной работы: будет показан пример технологии автоматического построения иерархической схемы по данным, хранящимся в репозитарии - файле excel (аналогично автопостроение возможно из базы данных, иных источников ODBC).

Читать далее

Как биостатистика помогала в пандемию COVID-19

Время на прочтение11 мин
Количество просмотров1.4K

В этой статье расскажем о проекте, реализованном во время первой и второй волн пандемии COVID-19. Сегодня его идеолог и основной разработчик — Евгений Бакин — учится в магистратуре в ИТМО на программе Public Health Sciences (мы писали о ней в блоге). Проект реализовывался вне стен университета, но, во‑первых, он интересен сам по себе — математические методы, примененные к стандартным анализам крови, на пике заболеваемости COVID-19 немного упорядочили хаос для врачей и помогли спасти жизни людей. А во‑вторых, проект и подтолкнул специалиста в магистратуру. Пандемия имела огромные социально‑экономические последствия и повлияла на систему здравоохранения — Евгений заинтересовался более высокоуровневым взглядом на проблему.

Читать далее

Visiology 3.2: вот теперь действительно можно в прод

Уровень сложностиСредний
Время на прочтение5 мин
Количество просмотров5.4K

Привет, Хабр! Сегодня мы делимся новшествами в нашем релизе Visiology 3.2, а также раскрываем улучшения, которые коснулись второй версии платформы в релизе 2.31. Самым важным событием этого обновления стоит считать отказ от маркировки Preview. Таким образом, начиная с Visiology 3.2 мы готовы предлагать нашу BI-платформу с поддержкой наиболее распространенных операторов DAX, визуальной моделью данных как альтернативу Microsoft Power BI и другим аналитическим системам. Под катом — новое в модели доступа, улучшение скорости на 60+%, подключение CSV, пользовательские виджеты и многое другое, в общем — подробный разбор улучшений в Visiology 3.2 и Visiology 2.31.

Читать далее

Ближайшие события

Подключение велокомпьютера к счётчику электроэнергии

Уровень сложностиСредний
Время на прочтение7 мин
Количество просмотров6.9K

В данной статье объясняется и демонстрируется возможность подключения дешёвого велокомпьютера к импульсному выходу счётчика электроэнергии с целью расширения его функционала.

Читать полностью

Экспресс-анализ данных на Python

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров8.2K

В рамках расширения своих компетенций периодически провожу анализ данных датасетов. В какой-то момент осознал, что трачу время на столбцы с аналитиками, в которых все в порядке. Данные полные, тип данных единый, интерпретация понятна. Если столбцов несколько десятков, то обзорная проверка атрибутов каждого столбца занимает довольно значительное время.

Читать далее

Методика оценки BI-систем от «Северстали»

Время на прочтение7 мин
Количество просмотров2.5K

До весны 2022 года для глубокой бизнес-аналитики мы применяли традиционные зарубежные решения. После ухода с отечественного рынка западных вендоров у нас встал вопрос о полной их замене. Меня зовут Андрей Первушин, архитектор BI-решений в «Северсталь-инфокоме». Сегодня я хочу поделиться методикой подбора отечественной BI-системы. 

Читать далее

FineBI 6.0: 9 полезных обновлений, о которых вы не знали

Уровень сложностиПростой
Время на прочтение3 мин
Количество просмотров3.2K

Хабр, привет! Меня зовут Регина Камалова, проджект-менеджер в Business Intelligence GlowByte. С того момента, как GlowByte представила российскому рынку вендора FanRuan и его инструмент для бизнес-аналитики FineBI, прошло уже больше года. Наши китайские партнеры не стоят на месте, активно развивают свои продукты и не так давно презентовали новую версию – FineBI 6.0. О полезных обновлениях и хочу рассказать сегодня.

Читать далее

Генеалогическое древо на Python

Уровень сложностиПростой
Время на прочтение10 мин
Количество просмотров6.9K

В этой коротенькой статье мы обсудим простенький и относительно не сильно извращённый способ сохранения информации о своей семье при помощи скриптов на Python. Для этого мы будем использовать модуль Diagrams.

Читать далее

Пишем приложение на Python для интерактивной визуализации графов с NetworkX, Plotly и Dash

Уровень сложностиСредний
Время на прочтение8 мин
Количество просмотров14K

Промпт: интерактивная визуализация сети транзакций, абстракция на белом фоне

Говорят, хорошая визуализация данных лучше тысячи слов о них, и с этим трудно спорить.

Эта статья посвящена написанию приложения на Python для интерактивной визуализации графов. В первой части представлен краткий обзор использованных средств и библиотек, а также свойства приложения. Во второй половине — технические детали, касающиеся использования NetworkX, Plotly и Dash, и собственно код.

В результате всего за 300 строк на Python получится веб-приложение с пользовательским интерфейсом, отображающим ориентированный граф с несколькими селекторами для настройки используемых данных.

Погнали!

Кот в колесе: как узнать, с какой скоростью и в какую сторону бегают котики

Уровень сложностиСредний
Время на прочтение5 мин
Количество просмотров6.7K

Да, это точно кот, а не большой чёрный хомяк. Оказывается, некоторые кошки тоже не прочь понаворачивать круги в колесе. Владелец кота по имени Cygnus (Лебедь) решил немного усовершенствовать кошачье беговое колесо и прикрутил к нему систему мониторинга. Рассказываем, как работает устройство и какие интересные факты о кошачьей активности можно из него извлечь.

А на что вы готовы ради своих котиков? 

Читать далее