Как стать автором
Поиск
Написать публикацию
Обновить
41.08

Визуализация данных *

Облекаем данные в красивую оболочку

Сначала показывать
Порог рейтинга
Уровень сложности

КЛКТ. Полноформатное исследование за полминуты

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров2.4K

Рентген-исследование – необходимая часть диагностики для решения очень многих задач. Однако этот этап часто вызывает вопросы, недопонимания и сомнения. Почему конусно-лучевой компьютерной томографии можно не бояться и что она расскажет о пациенте, отвечает рентгенолог клиник эстетической ортодонтии Конфиденция, Валентина Рощина. 

Для начала разберемся с тем, что такое КЛКТ. Конусно-лучевая компьютерная томография (КЛКТ) – метод 3D-диагностики высокой точности с применением компьютерного томографа. Таким методом диагностики пользуются многие специалисты, посмотрим кто и зачем.

Читать далее

FineBI-g brother is watching you: как мы начали анализировать действия пользователей в Fine

Уровень сложностиСредний
Время на прочтение8 мин
Количество просмотров3.1K

Привет, Хабр! Мы — BI-команда Tele2. В прошлом году, как и многие наши коллеги по рынку, мы столкнулись с проблемой поиска альтернативы BI-платформам покинувших нас вендоров. О том, как подходить к замене платформы, уже много рассказано здесь и на других ресурсах. В этой статье мы остановимся на конкретном кейсе — как мы решили задачу поиска и последующего анализа действий и полномочий наших пользователей, а также взяли под контроль обновление источников. Под катом мы рассказываем, как собрать датасеты в FineBI, на которых можно построить дашборды о дашбордах и получить данные о посещаемости отчетов, их расположении в директориях и доступах к ним пользователей.

Читать далее

Эти прекрасные древовидные карты (альтернатива pprint)

Уровень сложностиСредний
Время на прочтение7 мин
Количество просмотров5.9K

Древовидные карты — это инструмент визуализации, позволяющий обобщать данные разной формы и размеров. На сегодня они чаще всего используются для отображения файлов, занимающих всё пространство диска, но путём некоторых доработок их можно сделать гибким инструментом для анализа и навигации по беспорядочным массивам данных.
Читать дальше →

Разница между векторными и растровыми картами

Уровень сложностиПростой
Время на прочтение3 мин
Количество просмотров11K

При визуализации геопространственных данных часто используется картографическая подложка в виде Яндекс/Google/OSM/etc, которая в основном бывает двух видов - векторная или растровая. Однако, когда дело доходит до интеграции карт в свое приложение, то не всегда очевидно какой тип больше подойдет.

В этом посте мы рассмотрим основные различия между этими двумя типами и обсудим, когда следует использовать одно или другое. Но сперва давайте определимся что есть что.

Читать далее

Жизнь и смерть в данных

Время на прочтение10 мин
Количество просмотров7.3K

Мне тут стало интересно, а на сколько лет можно прожить больше если исключить те факторы риска, на которые можно влиять самому? Чтобы ответить на этот вопрос я взял открытые данные одного из самых масштабных исследований влияния факторов риска на смертность “Global Burden of Disease 2019” [1] и с их помощью рассчитал оценку увеличения ожидаемой продолжительности жизни при условии исключения управляемых факторов риска. Чтобы было интереснее я оформил результаты в виде дашборда куда можно зайти выбрать страну, пол, возраст и факторы риска и посмотреть результаты. Под катом подробнее о процессе обработки данных, исходники самого дашборда на питоне и конечно подробно посмотрим на графики, там интересно.

Читать далее

Анализ временных рядов, или как предсказать погоду на завтра

Уровень сложностиСредний
Время на прочтение9 мин
Количество просмотров16K

Прочитав статью, вы узнаете, как можно прогнозировать погоду с точностью до двух градусов на 3 месяца вперед, причем здесь преобразование Фурье и машинное обучение

Читать далее

Зачем и как переходить на российский BI? Мнение

Уровень сложностиСредний
Время на прочтение3 мин
Количество просмотров5.1K

Привет, Хабр! Я Максим Иванов, директор по развитию Modus, и сегодня я хочу поднять важный вопрос.

В 2022 году российский IT-рынок столкнулся с массовым оттоком международных и технологических корпораций. Рынок BI не исключение – популярные лидеры досанкционного рынка - Tableau, Power BI, Qlik, Sisense - ограничили работу с российскими компаниями.

У бизнеса возник вполне понятный вопрос – а как работать дальше?

Поделюсь мнением о том, почему стоит переходить на российский BI (не беру в расчет функциональные различия), и как происходит этот процесс. Поехали!

Читать далее

Широка, необъятна, интерактивна: оффлайн карта России с Plotly

Уровень сложностиСредний
Время на прочтение14 мин
Количество просмотров21K

Привет, Хабр!

На связи участник профессионального сообщества NTA Максим Алёшин.

Сегодня создание интерактивной карты на python не составляет большого труда: стоит подключить библиотеку (например, Folium или Bokeh), указать картографический сервер, и после выполнения нескольких «магических» строк кода ваши данные как на ладони!

Но что делать, если данные есть, визуализировать их хочется, а в сети, в которой вы работаете, нет доступа к картографическим серверам? В этом случае помогут Plotly и GeoPandas. Но придётся провести ряд подготовительных работ. В этом посте шаг за шагом я покажу, как построить интерактивную карту России по регионам с помощью Plotly, которая будет работать без интернета, регистрации и смс.

Оффлайн карта России с Plotly

Работа со скрипичной диаграммой (Violin Plot) в Seaborn

Уровень сложностиСредний
Время на прочтение7 мин
Количество просмотров8.7K

Скрипичные диаграммы могут эффективно отображать распределение данных, сравнивать различные наборы данных и выявлять аномалии (выбросы) и тенденции. В этой статье мы рассмотрим четыре различных стиля скрипичных диаграмм Seaborn, включая обычную, сгруппированную, горизонтальную и улучшенную версии, и разберемся в случаях их применения, преимуществах и недостатках. Мы также покажем, как улучшить код, чтобы нарисовать структурированную скрипку.

Читать далее

Работа с хребтами (ridge plot) в Seaborn

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров2K

Визуализация данных является важной частью анализа данных, помогая нам лучше понять данные, выявлять закономерности и тенденции. Среди многих инструментов визуализации данных библиотека seaborn пользуется популярностью благодаря относительной простоте в использовании и настройке достаточно красивых и информативных диаграмм.

В этой статье рассматривается вопрос касающийся использования библиотеки seaborn для создания красивых карт хребтов и разъясняется их использование, а также демонтируется гибкость библиотеки с помощью демонстрации кода.

Читать далее

Кейс: аналитическая система с ИИ для «ОЭЗ Технополис «Москва»

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров1K

Привет, Хабр! Сегодня кейс о том, как мы с партнером-интегратором разработали и внедрили аналитическую систему Modus с искусственным интеллектом для компании «Технополис "Москва"».

А еще как автоматизировали и систематизировали сбор и анализ более 250 ГБ данных в управляемый формат и выстроили аналитическую систему, которая охватила 8 сфер бизнеса и состояла из 35 дашбордов.

Читать далее

Пример уменьшения размерности данных с помощью линейных и нелинейных методов в Python

Уровень сложностиСредний
Время на прочтение7 мин
Количество просмотров16K

Уменьшение размерности данных широко используется в области машинного обучения и анализа данных. Его цель состоит в том, чтобы упростить обработку данных за счет уменьшения количества объектов в наборе данных при сохранении ключевой информации. Когда мы сталкиваемся с данными большой размерности, уменьшение размерности может помочь нам снизить вычислительную сложность, повысить производительность и результативность модели.

Читать далее

Как мы создавали тросы и их анимировали

Уровень сложностиСредний
Время на прочтение5 мин
Количество просмотров4.6K

В предыдущей публикации, первой по счету, мы рассказали кратенько о себе, чем занимаемся и про наши планы. Получили такое количество обратной связи (и по щам тоже – все за дело, заслужили) и за все благодарны (особенно за неразрушающийся контроль).

Во-первых, была поднята тема ответственности. Эта темы и без AI тяжела, а с ним то – и подавно. Дело даже не с технологии, AI или ML, или что угодно – это просто добавление еще одного звена, который еще больше усложняет всю систему. Тема ответственности за технологию – тема особая, требующая отдельного поста или даже серии постов. Мы пока не готовы к этому, но мысли есть на тему.

У одного из членов нашей команды есть научрук, доктор технических наук Ясницкий Л.Н., автор нашумевшей в свое время статьи «По ком звонит Ansys» как раз про ответственность технологии, включая гибель людей в Трансвааль‑парке в 2004 г. Всем советуем почитать, статья больше задает вопросы, чем отвечает, но мысль такая же как и в комментах к нашей первой публикации — надо создавать методологию ответственности.

Еще страшней тема в продолжении: алгоритм минимальности числа жертв при их неизбежности и степень его повсеместного применения или внедрения. Тут впору вспомнить «не убий» в Азимовском варианте. Уточним, Айзек Азимов в своем рассказе «Хоровод» ввел четыре правила робототехники, ну их правда изначально три было, потом добавился четвертый. Если же учесть, что в некоторые немецкие автомобили встроен AI, который работает не по принципу «минимальности жертв» при неизбежном ДТП, а по «мой хозяин должен остаться в живых, так как он меня за этим и купил», то поле для рассуждения становится просто необъятным. Вернемся к нашим тросам‑канатам.

Читать далее

Ближайшие события

Как мы пришли к созданию своего BI решения на NLP для получения отчетов прямо в мессенджер

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров4.3K

Занимаясь BI-решениями почти всю сознательную жизнь, я обнаружил, что на самом деле ими пользуются только в случае крайней необходимости.

Про BI вспоминают, когда аудиторы запрашивают детализированные данные для подготовки ежеквартальной/ годовой/ другой отчетности акционерам и топ-менеджменту. Причем очень часто business intelligence системы используются, чтобы сформировать итоговый Excel или PowerPoint. В лучшем случае BI могут применять аналитики для подготовки планов продаж или закупок. Топ-менеджеры, к сожалению, не пользуются BI практически никогда.

Мы придумали, как решить эту проблему и сделать принятие data-driven решений в компании намного проще.

Читать далее

Обновление Дельта BI. ChatGPT, PixelPerfect, коннекторы и визуализации

Уровень сложностиСредний
Время на прочтение5 мин
Количество просмотров1.5K

Совсем недавно вышло обновление платформы для бизнес-аналитики Дельта BI с решениями, знаковыми для всей отрасли. Учитывая нашу реальность и недоступность глобальных продуктов, обновление ощутимо увеличивает отрыв Дельта BI от ближайших конкурентов на российском рынке. Показываем и рассказываем, почему.

Читать далее

Ряд Фурье как Фильтр Нижних Частот

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров9.5K

Обычно когда говорят про ряды Фурье вспоминают, что они показывают частоты в сигнале. Однако преобразование Фурье показывает также и фазу для каждой частоты.

При этом я ни разу не видел, чтобы на основе преобразования Фурье делали фильтры нижних частот, а ведь, справедливости ради, можно заметить что из преобразования Фурье можно сделать отличный фильтр нижних частот.

Читать далее

Как мы снизили нагрузку на SAP HANA незаметно для пользователей

Уровень сложностиСредний
Время на прочтение5 мин
Количество просмотров2.4K

Объем информации в корпоративном хранилище данных (КХД) со временем неизбежно начинает превышать запланированные изначально мощности. Обычно эта проблема решается тем, что докупаются недостающие мощности (будет дорого). Когда с такой ситуацией столкнулся наш клиент, мы предложили ему другое решение. Оно позволило сэкономить бюджеты и сделать переходный период максимально безболезненным.

Читайте, что именно мы сделали и какой был результат.

Читать далее

Modus BI Cloud: работа с данными в облаке

Уровень сложностиСредний
Время на прочтение4 мин
Количество просмотров1.5K

Привет, Хабр, на связи product owner компании Modus Александр Чебанов. Сегодня поговорим про работу и анализ данных в облаке, а еще об архитектуре нашего нового облачного BI для малого и среднего бизнеса.

Читать далее

Департамент Big Data Tele2 научил ИИ анализировать автомобильный трафик по всей России

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров1.7K

И не просто анализировать, а делать выводы о социально-демографических характеристиках автомобилистов.

Читать далее

Из MS Azure в on-premise. Особенности одного «заземления» табулярной модели SSAS

Уровень сложностиСредний
Время на прочтение14 мин
Количество просмотров1.8K

Привет, Хабр! Меня зовут Николай, я DBA-разработчик SimbirSoft. В 2022 году многие мировые IT-гиганты дружно свернули свою деятельность и покинули старательно обустроенный под себя российский рынок. Клиенты быстро столкнулись с последствиями этих событий и вынуждены были искать альтернативные решения. Не будет преувеличением сказать, что наибольшему стрессу подвергались компании, использующие облачные решения. Стабильность их работы непосредственно зависела от провайдера в отношении обслуживания, обновлений и клиентской поддержки. Если провайдер прекращал  предоставлять качественные услуги, то это могло привести к значительным сбоям в работе клиента on-cloud сервиса. В интересах одного из них, пользователя Microsoft Azure Analysis Services (золотого стандарта современного IT), в течение почти 4-х месяцев наша небольшая проектная команда в срочном порядке решала задачу переноса критичной для бизнеса аналитической отчетности на привычный on-premise. 

Что нам необходимо было сделать: 

Подготовить новую инфраструктуру. 

Перенести, развернуть и адаптировать аналитическую модель.

Подтянуть данные из необходимых источников.

Перенести из MS Azure 15  бизнес-отчетов и запустить их в работу.

В этой статье я расскажу об особенностях этого проекта и о решениях, которые были в нем приняты. Информация может быть интересна руководителям проектов, аккаунт менеджерам, тимлидам,  аналитикам и разработчикам.

Читать далее