Все потоки

Визуализация данных *

Облекаем данные в красивую оболочку

СтатьиПостыНовостиАвторыКомпании

YuliyaCl 24 мар 2018 в 19:37

«Cделать красиво». Визуализация обучения с Tensorboard от Google

5 мин

37K

Машинное обучение * Визуализация данных * TensorFlow * Python * Google API *

Туториал

Красота, как известно, требует жертв, но и мир обещает спасти. Достаточно свежий (2015г) визуализатор от Google призван помочь разобраться с процессами, происходящими в сетях глубокого обучения. Звучит заманчиво.

Красочный интерфейс и громкие обещания затянули на разбор этого дизайнерского шайтана, с неинтуитивно отлаживающимися глюками. API непривычно скудный и часто обновляющийся, примеры в сети однотипны (глаза уже не могут смотреть на заезженный MNIST).

Чтобы опыт не прошел зря, решила поделиться максимально простым описанием инсайтов с хабравчанами, ибо рускоязычных гайдов мало, а англоязычные все как на одно лицо. Может, такое введение поможет вам сократить время на знакомство с Tensorboard и количество ругательных слов на старте. Также буду рада узнать, какие результаты он дал в вашем проекте и помог ли в реальной задаче.

Читать дальше →

+4

smile_artem 24 мар 2018 в 12:58

Пощупать нейросети или конструктор нейронных сетей

4 мин

112K

Визуализация данных * Машинное обучение *

Туториал

Из песочницы

Я давно интересовался нейросетями, но только с позиции зрителя – следил за новыми возможностями, которые они дают по сравнению с обычным программированием. Но никогда не лез ни в теорию, ни в практику. И вдруг (после сенсационной новости о AlphaZero) мне захотелось сделать свою нейросеть. Посмотрев несколько уроков по этой теме на YouTube, я немного врубился в теорию и перешёл к практике. В итоге я сделал даже лучше, чем свою нейросеть. Получился конструктор нейросетей и наглядное пособие по ним (то есть можно смотреть, что творится внутри нейросети). Вот как это выглядит:

Читать дальше →

+22

Ash666 23 мар 2018 в 11:55

Автоматический мониторинг свежеустановленного софта в ZABBIX

4 мин

11K

Визуализация данных * Серверное администрирование * Системное администрирование *

Туториал

В ZABBIX есть отличный механизм, который позволяет автоматически обнаруживать и ставить на мониторинг файловые системы, сетевые интерфейсы, CPU, ядера CPU и другие объекты. Но к сожалению тоже самое делать с софтом из коробки он не умеет.

С помощью всего пары скриптов, один из который необходимо положить на сервер, а второй раскидать по клиентам, можно сделать низкоуровневое авто-обнаружение nginx, mongod, rabbitmq, mysql, postgresql и любого другого сервиса.

Читать дальше →

+10

oldshowstopper 19 мар 2018 в 03:00

Как создать приложение c 3D аналитикой для iPhone?

9 мин

5.1K

Big Data * Unity * Визуализация данных * Открытые данные * 3D-графика *

Существует множество трендов и направлений в анализе данных, и все мы знакомы с популярными словами Business Intelligence, Big Data, Machine Learning и т.д. Эти слова знакомы сейчас даже тем, кто не знает как написать SQL-запрос, не знаком с правилами визуализации и отображения информации, и тем более не сможет написать Python-скрипт. Но всегда в нас остаётся незыблемое желание, воплощение мечты любого руководителя и/или даже аналитика данных: «нажимаешь на клавишу» и через миллисекунды нам уже приходит ответ на вопрос «Что делать?», а желательно пусть сразу «Прибыль компании увеличена».

Читать дальше →

+1

KoGor 12 мар 2018 в 08:27

Heatmap Painter

2 мин

9K

Big Data * JavaScript * Визуализация данных * Геоинформационные сервисы * Графический дизайн *

Heatmap Habr Moscow

Тепловая карта — картограмма, визуально показывающая интенсивность какого-либо точечного показателя в пределах территории на карте. Интенсивность кодируется цветом и прозрачностью. Наверняка вы не раз видели такие картинки. Так вот, что если вам нужно сделать такую картограмму, а данных на руках у вас нет. Heatmap Painter позволит вам в интерактивном режиме накидать данные на карту и сохранить результат для дальнейшего использования. Штука весьма интересная и может пригодится много кому: разработчикам, аналитикам, дизайнерам. О том как это работает и как использовать читайте далее.

Читать дальше →

+2

afrikyan 7 мар 2018 в 12:17

Работа с Anaconda на примере поиска корреляции курсов криптовалют

11 мин

77K

Открытые данные * Визуализация данных * Python * Open source * Data Mining *

Туториал

Цель этой статьи — предоставить легкое введение в анализ данных с использованием Anaconda. Мы пройдем через написание простого скрипта Python для извлечения, анализа и визуализации данных по различным криптовалютам.

Читать дальше →

+20

a-pichugin 6 мар 2018 в 09:59

Обзор нового алгоритма уменьшения размерности UMAP. Действительно ли он лучше и быстрее, чем t-SNE?

6 мин

33K

Блог компании New Professions LabBig Data * Data Mining * Визуализация данных * Машинное обучение *

Привет, Хабр! Задача снижения размерности является одной из важнейших в анализе данных и может возникнуть в двух следующих случаях. Во-первых, в целях визуализации: перед тем, как работать с многомерными данными, исследователю может быть полезно посмотреть на их структуру, уменьшив размерность и спроецировав их на двумерную или трехмерную плоскость. Во-вторых, понижение размерности полезно для предобработки признаков в моделях машинного обучения, поскольку зачастую неудобно обучать алгоритмы на сотне признаков, среди которых может быть множество зашумленных и/или линейно зависимых, от них нам, конечно, хотелось бы избавиться. Наконец, уменьшение размерности пространства значительно ускоряет обучение моделей, а все мы знаем, что время — это наш самый ценный ресурс.

UMAP (Uniform Manifold Approximation and Projection) — это новый алгоритм уменьшения размерности, библиотека с реализацией которого вышла совсем недавно. Авторы алгоритма считают, что UMAP способен бросить вызов современным моделям снижения размерности, в частности, t-SNE, который на сегодняшний день является наиболее популярным. По результатам их исследований, у UMAP нет ограничений на размерность исходного пространства признаков, которое необходимо уменьшить, он намного быстрее и более вычислительно эффективен, чем t-SNE, а также лучше справляется с задачей переноса глобальной структуры данных в новое, уменьшенное пространство.

В данной статье мы постараемся разобрать, что из себя представляет UMAP, как настраивать алгоритм, и, наконец, проверим, действительно ли он имеет преимущества перед t-SNE.

Читать дальше →

+17

KoGor 2 мар 2018 в 07:48

Графики послания президента РФ 2018

2 мин

39K

Визуализация данных * Графический дизайн *

Demography by year

Сразу скажу, пост не о политике и послании, а о том как НЕ нужно делать графики, вообще ни для кого не нужно так делать, тем более для президента, особенно когда аудитория столь обширная.

Читать дальше →

+84

Regza 28 фев 2018 в 08:02

Как использовать геймификацию в аналитике

5 мин

7.1K

Блог компании ГК ЛАНИТВизуализация данных * Анализ и проектирование систем *

Любая игра предполагает, что в ней есть сюжет, персонаж и действия, которые совершает персонаж для развития сюжета. Игры применяются повсеместно в образовании от детского сада до деловых игр на работе, всё это объясняется тем, что такой подход помогает легко и быстро усвоить материал. Но все мы знаем, что любые BI-системы нацелены на то, чтобы быстро и понятно донести до конечного пользователя большое количество информации, или так называемых ключевых показателей эффективности. Концепцию игры уже давно применяют в аналитике, только называют всё это «сторителлингом». Как же его применять в реальных жизненных ситуациях? Решает ли сторителлинг текущие проблемы возникающие при внедрении BI-систем?

+30

boyarskiy 21 фев 2018 в 14:23

Кейс «Мониторинг делового кредитного портфеля банка с помощью трехмерной визуализации»

10 мин

6.8K

Big Data * Визуализация данных *

Введение

В этой статье я поделюсь с вами нашим опытом решения интересной аналитической задачи с помощью нестандартных визуальных инструментов. Статья будет интересна людям, занимающимся анализом данных, а также банковским менеджерам, которые специализируются на мониторинге и анализе кредитного портфеля банка.

Приложение, про которое, собственно, буду писать ниже, выполнено на базе платформы iDVP (Interactive Data Visualization Platform).

Читать дальше →

+8

KoGor 19 фев 2018 в 11:35

Кольцевые столбчатые диаграммы в ассортименте

6 мин

7.7K

JavaScript * Визуализация данных * Векторная графика *

Туториал

Radial diagramms
Эволюционный подход в решении задач как нельзя кстати подходит для визуализации данных. Дивжение от простого к сложному, от одномерных данных к многомерным итерация за итерацией. В этой статье рассмотрим различные варианты круговых диаграмм, от самой простой одномерной до нестандартной самодельной многомерной. В качестве инструмента будем использовать D3.js. Всех заинтересованных прошу под кат.

Округлить диаграммы

+17

iggisv9t 19 фев 2018 в 11:18

Визуализация данных для киноманов: скрапим рекомендации фильмов и делаем интерактивный граф

11 мин

30K

Блог компании Open Data ScienceData Mining * Python * Визуализация данных * Машинное обучение *

Туториал

Однажды я наткнулся на интерактивную карту lastfm и решил обязательно сделать подобный проект для фильмов. Под катом история о том, как собрать данные, построить граф и создать своё интерактивное демо на примере данных с кинопоиска и imdb. Мы рассмотрим фреймворк для скрапинга Scrapy, пробежимся по методам визуализации больших графов и разберёмся с инструментами для интерактивного отображения больших графов в браузере.

Читать дальше →

+60

onetruecolor 15 фев 2018 в 09:55

Avito Data Science Meetup: Personalization

2 мин

4.2K

Блог компании AvitoTechData Mining * Визуализация данных * Машинное обучение * Программирование *

Привет! 27 февраля приглашаем практикующих специалистов по Data Science на митап, посвящённый персонализации пользователей. Вы услышите доклады от представителей Сингапурского Университета Менеджмента и Avito. Регистрируйтесь на встречу и приглашайте коллег. Под катом — тезисы выступлений, ссылки на регистрацию и видеотрансляцию митапа.

Читать дальше →

+21

sahsAGU 12 фев 2018 в 10:11

Какую диаграмму использовать?

4 мин

31K

Блог компании MicrosoftВизуализация данных * Управление медиа * Управление продажами * Финансы в IT

Туториал

С приходом технологий в каждый дом, появлением новых каналов для рекламы, программатика и прочих умных штук, позволяющих захватить внимание людей, растёт и количество данных, которые приходится анализировать маркетологам. Мы решили напомнить вам про один из наших замечательных инструментов Power BI. Представляем вам первую статью из серии от наших друзей из CoMagic.

Читать дальше →

+27

Uris 5 фев 2018 в 11:10

Особенности промышленной аэрофотосъемки

12 мин

23K

Анализ и проектирование систем * Визуализация данных * Геоинформационные сервисы * Спутниковые системы навигации * Обработка изображений *

Если отвлечься от съемки с помощью беспилотных летательных аппаратов (БПЛА) свадеб, торжеств и юбилеев, то становится очевидным, что в арсенале специалистов по картографированию территорий, экологов и военных появился мощный инструмент в работе — промышленные беспилотные аппараты, которые способны решать различные задачи по построению качественной картографической информации, подробных ортофотопланов территорий, лесов, сельскохозяйственных угодий и городских территорий. Учитывая тот факт, что получить качественный фотографический материал для построения 3D моделей местности только с первого взгляда кажется простым делом, в действительности — задача имеет массу всяческих особенностей. Захотелось поделиться собственным опытом организации промышленной аэрофотосъемки, местом расположения граблей, на которые пришлось наступить, а вернее — на которые пришлось налететь. За всеми подробностями прошу под кат.

Читать дальше →

+27

i_shutov 2 фев 2018 в 07:59

R как спасательный круг для системного администратора

3 мин

12K

Системное администрирование * Визуализация данных * R * Data Mining * Big Data *

Мотивом для этой публикации послужил доклад «Using the R Software for Log File Analysis» на конференции USENIX, который был обнаружен в интернете при поиске ответов на очередные вопросы. Поскольку была написана целая печатная статья, логично предположить, что тема обладает актуальность. Поэтому решил поделиться примерами решения подобного рода задач, решению которых не придавалось такого значения. Фактически, «заметки на полях».
R, действительно, очень хорошо подходит для подобных задач.

Является продолжением предыдущих публикаций.

Читать дальше →

+13

kricha 29 янв 2018 в 16:33

Лень пораБОТила instagram

7 мин

29K

Python * Интернет-маркетинг * Визуализация данных *

Предисловие

Сейчас многие используют инстаграм (далее инста): кто-то там собирает альбомы, кто-то продает, кто-то покупает, а я там ленюсь. Мне всегда было интересно как там поживают мои друзья, одноклассники, коллеги и инста в этом помогала. Захотел узнать, что там нового — зашел, полистал ленту, увидел все, что интересовало ушел… НО! Мне почему-то всегда нужно было лайкнуть каждый пост (не могу обьяснить зачем, но такие вот дела). И вот представьте, неделю туда не заходил, сидишь, лайкаешь недельный пул, а когда у тебя 200+ подписок — это вообще ад.

Читать дальше →

+3

qc-enior 28 янв 2018 в 18:16

Оформление базовой графики R

3 мин

20K

R * Визуализация данных *

Перевод

Базовая графика в R плоха для печати (если честно, можно было получше выбрать значения по умолчанию). В целом, эти функции для некоторых — признак заката эры R. Думаю, большинство людей согласится, что есть в R графические функции и получше (например, ggplot2). Но иногда бывет целесообразно сделать график именно с помощью базовых функций. Например, если графика в вашей публикации должна быть воспроизводима даже спустя пять лет.

В этом посте рассмотрим методы, позволяющие кардинально изменить внешний вид базовой графики в R. С некоторыми (окей, иногда большими) усилиями можно изменить все параметры графика именно так, как вам нужно.

Читать дальше →

+14

Ash666 26 янв 2018 в 06:57

Отключаем тригеры в ZABBIX по расписанию

2 мин

23K

Серверное администрирование * Системное администрирование * Визуализация данных *

Туториал

Я думаю многие задавались вопросом как отключить триггеры в zabbix на время прогнозируемой нагрузки, например на момент выполнения бэкапов. И я думаю многие легко решили этот вопрос, ну а те, кто ещё не придумал как это реализовать, добро пожаловать под кат!

Читать дальше →

+7

AloneCoder 25 янв 2018 в 13:14

Стоимость игр

11 мин

48K

Блог компании VKРазработка игр * Продвижение игр * Монетизация игр * Визуализация данных *

Перевод

Недавно я выступал в Анахайме (Калифорния) с докладом «Industry Lifecycles». Планировалось, что это будет коротким изложением моей публикации в блоге с небольшой порцией материала из другой моей недавней публикации об игровой экономике. Она наделала довольно много шума. На форумах развернулись дискуссии, в которых часто выражался скепсис в отношении представленных мной данных и сделанных выводов. Изначально статья была ответом на комментарии на разных сайтах, которые я собрал в виде вопросов-ответов. То есть я не опирался на единое исследование.

Читать дальше →

+37

1 2 ...

80

81 82 ...