Pull to refresh
116
Karma
0
Rating
Таня Мисютина @infotanka

User

БДСЛ-2017: Таня Бибикова о визуализации данных

Лучшее, что есть по теме — четыре книги Эдварда Тафти. Ещё посмотрите книги Натана Яу: www.amazon.com/Nathan-Yau/e/B004S83IUE

Алгоритм визуализации сложных данных

Спасибо за приятные слова :-)

Поделитесь, какая тема была у вашей «диссертации»?

5 экспериментов по визуализации данных

Спасибо! Про эталонное время классное предложение. Про «аудиографики» мы тоже думали, но они, на мой взгляд, слишком громоздкие для этой задачи.

Одним большим графиком в погоде обошлись, потому что в рамках экспериментов реализуем только функции, необходимые для демонстрации идеи (наш вариант MVP).

А Лаборатория сейчас равномерно распределена между Крымом, Питером, Ригой и Гуанчжоу :-)

Онлайн-курс «Визуализация данных. Основы»

Друзья! Курс стартовал: brainwashing.pro/dataviz-online

Сегодня мы открыли лекции и практическое задание, посвящённые дизайнерским принципам работы со сложными данными. 8 ноября откроется технический блок «Основы D3.js», а 16 ноября мы опубликуем решения практических заданий для самостоятельной проверки.

Прежде чем приступить к обучению, пожалуйста, ответьте на пару вопросов: docs.google.com/forms/d/1JcVDrqH1Qh178xrOjoTLIOyNGGahnzAUo2cy29qm6Ps/viewform

Онлайн-курс «Визуализация данных. Основы»

Ну там чёрным по белому написано «institutional level» — это явно не про нас.

Онлайн-курс «Визуализация данных. Основы»

Для общих еженедельных сессий я предложу 17.00 в пятницу или 10.00 в субботу. Какой вариант подойдёт большинству участников, на том и остановимся. Время индивидуальной сессии обговаривается заранее и может быть любым.

Онлайн-курс «Визуализация данных. Основы»

На курсеру непонятно, как попасть. Да и есть своя родная учебная платформа :-)

Онлайн-курс «Визуализация данных. Основы»

Обсуждения в платной группе ведутся в бейскемпе и в скайпе. На первом курсе попробуем такую схему:
1. Комментарии в бейскемпе по промежуточным результатам дважды в неделю в соответствии с графиком дедлайнов.
2. Еженедельная групповая скайп-сессия вопросов-ответов с преподавателями.
3. Однократная индивидуальная получасовая скайп-сессии вопросов-ответов с преподавателями в любой день с 1 по 30 ноября.

Онлайн-курс «Визуализация данных. Основы»

Дизайн:
1. Визуальное кодирование.
2. Микро- и макроуровень.
3. Интерактивность.

Программирование:
1. Основы SVG и D3.
2. График на D3. Загрузка данных, шкалы, оси.
3. Хитмап (теплокарта) на D3. Интерактивность, цветовая шкала.

Практика закрепляет и развивает теоретическую базу.

Роза кишечных бактерий

Во-первых, в D3 есть встроенные функции для работы с данными (в нашем случае, .csv файлами) и возможность отобразить эти данные без лишних хлопот.

Во-вторых, никаких ограничений на формат отображения, можно запрограммировать любую, самую экзотическую визуализацию — чем мы и воспользовались.

В-третьих, достаточно просто добавить интерактивность и оживить статичные диаграммы.

В-четвёртых, результат можно просматривать локально или выложить в интернет, для удобного доступа всех участников процесса и заинтересованных лиц.

Роза кишечных бактерий

Насколько я понимаю, филогенетическое расстояние — это мера близости геномов, вычисленная на основе совокупности генов. Чем больше отдельных генов в геноме совпадают, тем ближе образцы, тем меньше расстояние. Конкретную формулу лучше уточнить у коллег-учёных, мы использовали готовое предрассчитанное значение.

В эксперименте собранны данные от 383 человек — столько же у нас радиусов. Распределение для каждого образца строится на своём радиусе. Фактически, угол определяется номером образца.

Роза кишечных бактерий

Я — большой противник «закручивания по кругу» ради вау-эффекта. Тут же по смыслу есть понятие центра, особенно с случаях с одним образцом.

Впрочем, вы правы, строить развёртки в декарте никто не мешает тоже.

Роза кишечных бактерий

Спасибо, думали над этим. Теперь точно попробуем :-)

Роза кишечных бактерий

Внутри страны образцы отсортированы по городу, там где такие данные есть (Россия). Чтобы сравнивать розы между собой, радиусы должны однозначно соответствовать образцам. Поэтому идея с сортировкой не сработает: сортировка будет постоянно перемешивать радиусы внутри стран для разных образцов и бактерий.

Роза кишечных бактерий

Увеличение есть, ползунок под розой в живом прототипе. Прозрачность используется, чтобы риски читались даже при наложении друг на друга.

Про зелёный соглашусь, сделаем его чуть темнее.

Визуализация личных расходов

Насколько я знаю, Минт не работает с российскими банками. Основной недостаток круговых диаграмм в том, что невозможно увидеть динамику по месяцам — только суммарные данные за период.

Визуализация личных расходов

Прошу прощения, в пример закрались лишние столбцы. Должно быть 5 полей и 5 значений:
13/01/12 15:21;470; Хлеб насущный; рестораны; Россия;

Визуализация личных расходов

Сделали возможность посмотреть на траты без учёта наличных: budget.datalaboratory.ru/

Визуализация личных расходов

Спасибо, поправила!

Визуализация личных расходов

Эксперимент не подойдёт любителям секретности, это уж точно!

Information

Rating
Does not participate
Location
Москва и Московская обл., Россия
Registered
Activity