Как стать автором
Обновить

Комментарии 40

Да демографическая проблема сейчас на самом деле основная в мире. есть ли подобный карты для других частей мира?

Пока нет. Но метод совершенно генерализованный, можно запросто кинуть любые данные на карту. Сделаю на досуге Россию и США.

НЛО прилетело и опубликовало эту надпись здесь

Все можно, только данные нужны. Данные о население очень простые, но вот с пространственной привязкой не всегда просто.

А как это сделать для конкретного региона и Росии самостоятельно? Статистические данные есть, границы регионов тоже.
неужели нет публичных дата сетов по итогам последних переписей?
ООН ЮНИСЕФ или кто там ведь ведут такую статистику…
какие именно данные нужны и в каком формате?
Сделайте, пожалуйста.
Очень интересна такая визуализация.
Поддерживаю.
Хотелось бы данные по всей Европе, а не только её части

Я использовал данные Eurostat для всех стран, которые приняли систему административного деления NUTS.

Как интересно на фоне остальных выделяется Ирландия, хотя вот Турция с такими же цветами нет.
в Ирландии традиционно высокий (для Западной Европы) суммарный коэффициент рождаемости (СКР). Там более сильное влияние религии на менталитет
И аборты разрешили только в этом году.

Тут у товарища из Ирландии более любопытное объяснение

Наверное из-за уровня в жизни. Помнится, Ирландия держалась в топе по ИРЧП довольно долго.
С ума сойти, у вас есть публикация в Lancet — мои поздравления!
Таким не грех хвастаться и просто так, не говоря уж о том, что рассказать публике о том, как опубликоваться в ланцете.

Спасибо! Думаю, что "рассказать публике" нечего (см. картинку в подвале). Это очень нестандартная публикация для Ланцета, тем более для формата писем. Пожалуй, один вывод можно сделать уверенно: красивая визуализация нравится всем, в том числе и редакторам журналов. Нет, еще вывод: стоит пытаться.


Как опубликоваться в The Lancet
Интересно бы взглянуть на национальный состав. Возможно население трудоспособного возраста имеет заметную долю мигрантов.

Несомненно. Но тут значительно сложнее с данными. Качество данных о миграции традиционно отвратительно. Исследователи прибегают к косвенным методам оценивания. Вот пример:
Wilson, C., Sobotka, T., Williamson, L., & Boyle, P. (2013). Migration and intergenerational replacement in Europe. Population and Development Review, 39(1), 131–157. https://doi.org/10.1111/j.1728-4457.2013.00576.x
Это одна из моих самых любимых статей. В студенческие годы я ее даже перевел на русский. Очень рекомендую, если интересна миграция.
Уилсон, К., Соботка, Т., Уильямсон, Л., & Бойл, П. (2015). Миграция и замещение поколений в Европе. Демографическое Обозрение, 2(1), 56–88. https://demreview.hse.ru/article/view/1789


Пара картинок из статьи
There are three kinds of lies: lies, damned lies, and statistics. :) особенно, если вопросы как-то касаются политики.
Слишком много цветов на карте и по легенде частенько сложно сказать, что они означают. Есть ли возможность сгруппировать в, например, 9 групп с отдельным цветом для каждой? Как по мне — это наглядней. Текущая карта — слишком детально. К тому же данные по населению, скорее всего, примерные. Например, для меня Норвегия — полная загадка, что у них происходит, если просто сравнить карту и легенду.
Javian
Интересно бы взглянуть на национальный состав. Возможно население трудоспособного возраста имеет заметную долю мигрантов.
Лучше нац. состав на другой карте и просто накладывать, при желании, ибо если еще эти данные внести, то получится такой винегрет, что не разберешь.

Есть такая возможность в нашем пакете tricolore. Но, конечно, надо делать отдельно.


пример (другие данные)
install.packages("tricolore")
library(tricolore)
DemoTricolore()
А не лучше было использовать чистые цвета RGB?
То есть например, Working Age — это чистый 0, 0, 255.
Young — 255, 0, 0.

Тогда области со сбалансированным населением были бы просто белыми, а не имели этого сложного грязного цвета.

Была такая попытка. Все сотрудничество с Йонасом у меня началось с идеи применения здесь perceptionally balanced color scheme.


RGB

image

А почему от этого варианта отказались?

Теоретически CYMK цвета правильнее для отображения композиций.
Schöley, J., & Willekens, F. (2017). Visualizing compositional data on the Lexis surface. Demographic Research, 36(21), 627–658. https://doi.org/10.4054/DemRes.2017.36.21

А по-моему понятнее так. Красное — старое население, красное цвет проблемы. Зеленое — «можно идти» (работать), синее — юность.

Худший вариант для людей с нарушениями цветовосприятия. Только создав эту карту, я с удивлением понял, как же их много

Демографические проблемы отображались бы при делении на «дети и студенты / трудоустроенные / безработные и пенсионеры», а не тупо по возрасту.
Что-то мне подсказывает, что 64-летний британец куда как экономически активнее 64-летнего курда.
НЛО прилетело и опубликовало эту надпись здесь
Если учесть:
1. что британец выходит на пенсию в 65 лет,
2. что курд выходит на пенсию в 60 лет (это возраст выхода на пенсию в Турции и Иране)
то ваше утверждение не корректно.
У британца — просто денег больше.
Думаю зависимость обратная.
Чем экономически активнее человек, тем у него денег больше.
НЛО прилетело и опубликовало эту надпись здесь
Всё равно цвета будут грязно серыми, а не чисто белым. Надо еще яркость на максимум cтавить. А вообще тут дело привычки скорее. Так как в оригинальном просто используется базис голубой, пурпурный и жёлтый, удобней для печати.
Тут вопрос был в том что смешивание цветов происходит с уменьшением их яркости. Видимо типа при 33% каждого компонента, яркость компоненты снижается на 66% и в сумме получается темносерый цвет. Но возможно было бы красивее повышает общую яркость наибольшей компоненте до максимума и остальные пропорционально. Тогда при равных пропорциях получился бы белый цвет, а на гифке в центре всегда темно серый при любых значениях цвета в углах.

Что-то вроде этого вам хочется?


tricolore::DemoTricolore()

image

Да, так гораздо лучше! Сбалансированное население — это ведь отсутствие проблемы, значит, логичней всего оставить белым. Чем темнее фон, тем больше дисбаланс. Ну а сам цвет уже показывает, в какую сторону этот дисбаланс.
Гораздо логичней, чем первоначальный вариант с каким-то сложным серобуромалиновым для сбалансированных областей.

Проблема в том, что нам хочется сохранить максимальное визуальное разнообразие оттенков цвета. А это, чисто теоретически, достигается при идеально сером цвете центра ("grey50")

Среднее по европе — не значит идеально сбалансировано. Вот если было бы теоретическое исследование оптимума по таким категориям возрастным, тогда можно было бы центрировать серый на нём, и посмотреть где проблемы есть, а где всё чётко.
хм, мой R пишет радостное «plot.tag» is not a valid theme element name.

Да, мне писал на почту еще один человек с той же ошибкой. Пока могу предположить, что проблемы возникают из-за: 1) обновления ggplot2 (использована версия 2.2.1); 2) обновления R (использована версия 3.4.3)

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации

Истории