Обновить
47.22

Визуализация данных *

Облекаем данные в красивую оболочку

Сначала показывать
Порог рейтинга
Уровень сложности

Как построить систему аналитики на open-source — туториал по cube.js

Время на прочтение9 мин
Охват и читатели17K

Сube (до недавнего времени cube.js) относительно молодой проект (первый релиз март 2019) - реализация концепции OLAP-куб. Несмотря на отличную документацию, в интернете пока что мало информации на русском языке. Если вы выбираете систему аналитики, приверженец open-source или просто хотите узнать об альтернативах Power BI и Tableau, то это статья для вас. Обзор платформы и применение на реальном примере.

Читать далее

JavaScript редактор диаграмм, который открывает диаграммы из PNG картинок (open source)

Время на прочтение3 мин
Охват и читатели8.4K

dgrm.net | GitHub

dgrm.net - это редактор диаграмм, с прицелом на трансформацию в карту знаний.

Отличительные особенности:
- аскетичность,
- работает на телефонах (одно из немногих web-решений),
- открытый исходный код.

В процессе разработки появляются интересные моменты. Статья про один из таких моментов: чтение данных из PNG.
Исходный код для использования в своих проектах прилагается.

Читать далее

Визуализация данных с помощью веб-фреймворка Dash (часть 2)

Время на прочтение3 мин
Охват и читатели5.5K

В предыдущей части статьи мы разбирали, что такое dash в общем, и создавали одностраничный дэшборд, взяв за основу датасет драгоценных камней с kaggle.

Но! Задачи, которые падают на нас ,не всегда просты и не всегда возможно ограничить себя  одной страницей на Дашборде. В этой статье я покажу, как создать многостраничный дэшборд, используя sidebar в качестве навигационного элемента, и наполнить страницы разного рода контентом.

Читать далее

Как внедрить информационную систему управления проектами, чтобы она «взлетела»?

Время на прочтение7 мин
Охват и читатели11K

Если вы приняли решение внедрить систему управления проектами – а особенно, если вы делаете это впервые, то наверняка задаетесь вопросом: как сделать все правильно, минимизировать ошибки, прийти именно к тому результату, который ожидаете?

Прежде всего, нужно понимать, что внедрение информационной системы управления проектами (ИСУП) существенно отличается от внедрения других классов информационных систем. Если вы внедряете, например, систему биллинга, или финансового учета или систему управления складом – то ваше внедрение в некотором смысле обречено на успех. В определенный момент возврат к прежним инструментам становится невозможным, а без использования нового инструмента бизнес попросту остановится. В итоге внедренная система будет работать, даже если процессы настроены не оптимально, и дефекты латаются на ходу.

С ИСУП все не так однозначно: эффекты от внедрения наступают далеко не сразу, видны не на всех уровнях управления, в умах пользователей возникают сомнения, а нужно ли это все, ведь работали как-то раньше, и неплохо работали.

Именно поэтому систему управления проектами недостаточно установить и настроить. Недостаточно даже обучить пользователей и написать для них инструкции. Что еще можно сделать, чтобы ваши усилия и деньги были потрачены не зря, обсудим ниже.

Читать далее

Geo data in Python

Время на прочтение3 мин
Охват и читатели13K

Понадобилось мне недавно нарисовать в Python данные на карте, благо в данных есть координаты. Казалось бы, что может быть сложного... Но обо всем по порядку.

Читать далее

FlyBI: к взлёту готов

Время на прочтение6 мин
Охват и читатели5.8K


«Форсайт» выпускает новый продукт, дающий полную свободу в визуализации и анализе данных.

FlyBI – российский продукт класса Self-Service BI, позволяющий легко визуализировать данные и решать задачи Data Discovery с помощью обширной библиотеки визуализаторов без привлечения ИТ-специалистов.

В этом интервью создатели продукта FlyBI – старший продуктовый менеджер Евгений Богданов и владелец продукта Илья Головкин – расскажут о том, для каких задач можно использовать новый инструмент, в чем его основные преимущества и на каких пользователей он ориентирован.
Читать дальше →

Как дроны помогают нам управлять состоянием дорог в рудном карьере

Время на прочтение4 мин
Охват и читатели3.9K

Привет, Хабр! Беспилотные летательные аппараты (БПЛА) часто используются в горнодобывающем производстве, чтобы ускорить и обезопасить работы в карьерах. В НЛМК мы, в частности, применяем дроны для анализа состояния дорог на Стойленском ГОКе, потому что хорошая дорога позволяет расходовать меньше топлива для автотранспорта, дольше сохранять шины и, конечно, делает работу водителей комфортнее и безопаснее.

Читать далее

Обнаружение новизны изображений с помощью Python и библиотеки scikit-learn

Время на прочтение3 мин
Охват и читатели4.7K

В статье я расскажу, как с помощью библиотек scikit-learn, opencv, numpy, imutilsс выявить новизну входных изображений. Многие программы требуют наличия возможности решить, принадлежит ли новый объект тому же распределению, что и существующие объекты (это промежуточный результат), или его следует рассматривать как новизну. Часто эта возможность используется для очистки реальных наборов данных.

Читать далее

Gartner предсказывает взрывной спрос на Decision Intelligence. Что это – очередной хайп или новое слово в менеджменте?

Время на прочтение8 мин
Охват и читатели3.9K

В конце прошлого года эксперты Gartner выпустили очередной отчет, в котором выделили 12 важнейших трендов развития. И поскольку коллеги из издания СберПро попросили меня прокомментировать эти тенденции (их обзорный материал можно почитать тут), я просто не мог не обратить внимание на общую тенденцию, которая объединяет значительную часть из перечисленных технологий — нарастающую потребность в data-driven подходах. Об этом и поговорим в сегодняшнем посте.

Читать далее

Машинное стереозрение для новичков: две камеры Raspberry Pi и Python

Время на прочтение8 мин
Охват и читатели29K

Стажируясь в правительственном технологическом агентстве Сингапура, автор материала работал над экспериментом по созданию альтернативы камере Intel Relsence. Оказалось, что учебных материалов на тему машинного зрения мало, поэтому он решил помочь новичкам. К старту флагманского курса по Data Science приглашаем под кат за подробностями.

Читать далее

JET BI. Новый релиз отечественной BI-платформы

Время на прочтение5 мин
Охват и читатели5.1K

Привет. Меня завут Альберт Нурутдинов, я архитектор в "Инфосистемы Джет". В этой статье я рассказывал, как и почему мы создали свою Business Intelligence платформу. Но время не стоит на месте, и мы стараемся не отставать. В конце 2021 года мы сделали новый релиз JET BI и сегодня расскажем вам о новых возможностях платформы, сложностях, с которыми мы столкнулись при их разработке, а также о перспективах развития.

Раскрываем секреты

Снижаем размерность

Время на прочтение3 мин
Охват и читатели6.6K

Всем привет! Рассмотрю два популярных алгоритма уменьшения размерности, а именно T-distributed Stochastic Neighbor Embedding (t-SNE) и Uniform Manifold Approximation and Projection (UMAP). Их удобно использовать, когда необходимо визуализировать данные с большим количеством параметром (также будем называть это размерностью данных).

Читать далее

Мультимодальные нейронные сети, как искусство

Время на прочтение8 мин
Охват и читатели14K

В прошлой статье, рассказывая про GPT-J-6B, я упоминал, что современные алгоритмы обработки естественного языка вызывают немалый ажиотаж даже среди людей, мало слышащих про машинное обучение. И вот, не успел ещё стихнуть шум обсуждений про возможности GPT-3 от OpenAI, как нам показали ещё одну работу их команды в области ИИ, которую назвали в честь Сальвадора Дали и робота ВАЛЛ·И – DALL-E.

Читать далее

Ближайшие события

Подробнее о нашей BI-системе в Домклик

Время на прочтение8 мин
Охват и читатели3.2K

Приветвую, не так давно вышла первая статья с общим описанием нашей самописной BI в Домклик. А сегодня хотелось бы подробнее поговорить про технический концепт этого инструмента. Если интересно, прошу под кат.

Читать далее

NEO4J – графовые базы данных

Время на прочтение9 мин
Охват и читатели73K

В данной статье будет рассмотрена графовая система управления базами данных в Neo4j, а именно:

Читать далее

Единый семантический слой BI и что он дает на примере платформы Microstrategy

Время на прочтение6 мин
Охват и читатели14K

Ежедневно я общаюсь с большим количеством крупных компаний. Нередко они выражают желание построить data-driven компанию в течение следующих нескольких лет. Их ключевая стратегия заключается в создании DWH/Big data и подключении к ней пользователей, которые сами будут строить отчеты, визуализации и дашборды, используя self-service инструменты - Tableau, Power BI или Qlik.

Одна из основных проблем Tableau, Power BI или Qlik - у них нет единого семантического слоя, единой логической модели, единого определения всех атрибутов, фактов и показателей для всей бизнес-аналитики компании. Именно поэтому они растут в компании без контроля и governance, порождая множество версий правды в отчетности и аналитике в компании. Через какое-то время компании сталкиваются с тем, что уже не могут разобраться какому отчету доверять - данные не сходятся не только в разных системах Tableau, Power BI или Qlik, но и между отчетами в одной системе. Получается, что компании вкладывают огромные средства в построение единой версии правды на уровне хранилищ данных, а в конечном счете получают невероятное количество отдельных и ungoverned отчетов, визуализаций, дашбордов, которым они не могут доверять.

Tableau, Power BI и Qlik - отличные инструменты, если вы хотите, чтобы бизнес-пользователь мог выполнять локальную аналитику self-services для нужд своего отдела. Тем не менее, чтобы построить data-driven компанию на уровне всего предприятия, вам потребуется инструмент, который позволит упорядочить, структурировать и стандартизовать всю вашу бизнес-аналитику. 

Читать далее

Stacks Project — учебник по алгебраической геометрии с открытым исходным кодом

Время на прочтение5 мин
Охват и читатели8.1K

Последние 15 лет профессор Колумбийского университета Йохан де Йонг посвятил тому, что собирал основополагающие теоремы алгебраической геометрии в одном месте. Его творение, Stacks Project, предлагает новую модель организации и визуализации математических сведений.

К старту флагманского курса по Data Science рассказываем о проекте профессора.

Читать далее

Как мы делали сквозную аналитику из 1C в Power BI

Время на прочтение7 мин
Охват и читатели22K

В странах СНГ, принято создавать отчеты о деятельности компании в сводных таблицах Excel. Сказать, что это не юзабельно и не юзерфрендли для сложных отчётов – ничего не сказать. 

Можно, конечно, попытаться как-то спасти положение различными графиками диаграмм, поэкспериментировать с VBA, попробовать с его помощью создать дашборд на стероидах, но надо быть готовым к тому, что графика будет начала нулевых, а сам отчёт скорее всего не будет интерактивным. Помимо этого, такие гибриды смотрятся некрасиво на мобильных устройствах и чаще всего оказываются совсем нечитабельными. Проблемой посерьёзнее является частота заполнения данных – раз в месяц, в лучшем случае. Это приводит к тому, что руководитель не может смотреть на положение бизнеса в режиме реального времени и предотвращать проблемы. Ему приходится мириться с положением дел в конце каждого месяца и решать всплывшие проблемы. Столько негатива, а ведь мы ещё даже не перешли на стадию автоматизации выгрузки данных в Excel, где и таятся все «черти» этого тихого омута.

В связи с этим, мы решили поделиться нашим опытом, чтобы помочь наибольшему количеству начинающих специалистов справиться с задачей подключения 1С к Power BI.  

Читать далее

Как выглядит рельеф Марса? Выясняем с помощью Python

Время на прочтение9 мин
Охват и читатели7.9K

К старту флагманского курса по Data Science делимся визуализациями марсианского ландшафта на основе изображений, полученных благодаря беспилотным полётам над поверхностью планеты. За подробностями приглашаем под кат.

Читать далее

Пять лепестков лотоса: вычисляемые поля в Tableau

Время на прочтение6 мин
Охват и читатели5.7K

Лонгрид, в основном, предназначен для Tableau Creators - хотя и для адептов других BI тулов здесь может найтись что-то интересное и полезное.

Давайте призовём немного флэшбеков. Восстановите в памяти момент, когда вы получили на поддержку отчет, созданный другим человеком. С целой простыней доработок. Да ещё и без возможности задать вопросы автору отчёта. Наверняка потребовалось время, чтобы понять и простить продраться и осознать

Вспомните, что было сложнее всего? Уверена, многие назовут логику расчётов - восстановление потока мыслей даже в коде собственной разработки, которого не касаешься несколько месяцев - та ещё мистика

Сегодня я хочу поговорить о нескольких несложных приёмах работы с вычислениями. Я не буду рассказывать о том, как устроены расчеты сами по себе - в посте - подборка из пяти практик, которые помогут вам качнуть скилл - и избежать репутации ?кодера среди коллег

Читать далее