Уважаемые коллеги, дорогие читатели. С момента выхода статьи прошло не так уж много времени, но в проекте произошли очень существенные изменения. Запущен веб сайт https://webmedstat.ru по визуализации данных медицинской статистики. Запущен телеграм канал https://t.me/WEBmedSTAT На нем анонсируются новости проекта и статьи по анализу выполненной визуализации данных. Приглашаем всех заходить, читать, подписываться. Уверены, будет интересно. Надеемся на живое участие в обсуждении: комментарии, реакции эмодзи приветствуются. Отдельное спасибо за рекомендации канала друзьям и знакомым, всем кому небезинтересна тема визуального отображения медицинской статистики. Заканчивается третья мастерская по визуализации данных медицинской статистики, по результатам которой мы непременно напишем и опубликуем еще одну статью.
Тут разные инструменты использовались на разных этапах развития. На самом первом этапе я перепробовал полтора десятка разных общедоступных PDF конвертеров, прежде чем нашел приемлемый под эти задачи. И это была истинная каторга. Сейчас мы используем собственные Python инструменты для этих целей, которые никак не обсуждались и не подвергались коллективному использованию в мастерской. Возможно мы проведем в будущем мастерскую по конвертации данных из PDF в таблицы. Это на усмотрение команды, если будет сочтено интересным. Но у нас была еще одна мастерская по обработке сырых данных и агрегации таблиц. Она была достаточно востребованной и резонансной. Но там я участвовал "самым краешком". Если автор и инициатор той мастерской (Антон Ермолин) захочет о ней рассказать читателям Хабра, то я буду очень рад. Вообще обработка данных это отдельная большая тема. Там свои премудрости и свои курьезы. Вот один из таких курьезов. При подготовке к к первой мастерской был выявлен "Феномен Чеченской Республики" (так мы назвали это явление) Некоторые онкологические показатели в Чечне были в сотни раз иногда в тысячи таз выше соседних регионов. Оказалось, что многие таблицы были свёрстаны в логике бумажного формата А4 и часто разбиты на две страницы. И этот "разрыв списка территорий" как раз приходился на строчку "Республика Чечня" и конвертер каждый раз номер страницы распознавал как цифры и по своей какой то дремучей логике добавлял две - три цифры номера страниц к какому ни будь онкологическому показателю в Чечне увеличивая его на 2- 3 порядка. Выявили, откорректировали, но перепуг был не шуточный. Конвертация данных, дело тонкое....
Злободневненько. Анктуально. Вот листаю ХэдХантер и вижу вакансию "Аналитик" и понимаю что не стоит откликаться. К этому работодателю не нужно идти работать. Или написано "Системный аналитик", а в описании вакансии описан явный функционал аналитика данных. Тоже не буду откликаться. Нежелание некоторой части работодателей "вникать в тонкости" явным образом указывает на то, что и в работе тебя будут озадачивать чем угодно: "Иди сделай что говорят, или ты не тот, за кого себя выдаёшь"
Это не графики, это дашборды, Отличия от графиков в том, что пользователь имеет возможность сам выбирать интервалы времени, сортировать показатели, отфильтровывать заболеваемость мужскую, женскую., Выбирать возрастные группы, локализации опухоли. И в зависимости от его (пользователя) настроек меняются графики.
Инструмент с помощью которого все это сделано YandexDataLens. Кстати, он бесплатный. И есть для него курсы обучения, тоже бесплатные... Так что... Было бы желание
Совсем ничего что комментом. Спасибо за реакцию. Весьма отрадно что это читают и обращают внимание на такие детали. Я сейчас свяжусь с автором дашборда и попрошу прокомментировать или исправить или дать пояснение. Очевидно Вы имеете в виду правую диаграмму на первой вкладке.
Привет,@Mckar.Спасибо за оценку. Но про то что мы опоздали, так точно не соглашусь. Ведь эти данные будут актуальны всегда. Следующий после 2021 отчет 22-го года вышел в октябре 23-го. Когда у нас уже полным ходом шла мастерская. И мы конечно же продолжим этот проект, не только добавив туда данные 22-го, 23-го и всех последующих годов. Но так же и данные за предшествующие года начиная с 2007 го и отчасти с 1993 го. The Show Must Go On !!!! И кстати, буду очень признателен за ссылку на вторую часть отчета 22-го года. Пока что у меня есть только ссылка на "Состояние онкологической помощи в России в 2022" А второй части отчета там где Злокачественные новообразования в Росссии в 2022 У меня так пока что и нет. Так что буду очень признателен за ссылку
Уважаемые коллеги, дорогие читатели.
С момента выхода статьи прошло не так уж много времени, но в проекте произошли очень существенные изменения. Запущен веб сайт https://webmedstat.ru по визуализации данных медицинской статистики. Запущен телеграм канал https://t.me/WEBmedSTAT На нем анонсируются новости проекта и статьи по анализу выполненной визуализации данных. Приглашаем всех заходить, читать, подписываться. Уверены, будет интересно. Надеемся на живое участие в обсуждении: комментарии, реакции эмодзи приветствуются. Отдельное спасибо за рекомендации канала друзьям и знакомым, всем кому небезинтересна тема визуального отображения медицинской статистики. Заканчивается третья мастерская по визуализации данных медицинской статистики, по результатам которой мы непременно напишем и опубликуем еще одну статью.
Тут разные инструменты использовались на разных этапах развития. На самом первом этапе я перепробовал полтора десятка разных общедоступных PDF конвертеров, прежде чем нашел приемлемый под эти задачи. И это была истинная каторга. Сейчас мы используем собственные Python инструменты для этих целей, которые никак не обсуждались и не подвергались коллективному использованию в мастерской. Возможно мы проведем в будущем мастерскую по конвертации данных из PDF в таблицы. Это на усмотрение команды, если будет сочтено интересным. Но у нас была еще одна мастерская по обработке сырых данных и агрегации таблиц. Она была достаточно востребованной и резонансной. Но там я участвовал "самым краешком". Если автор и инициатор той мастерской (Антон Ермолин) захочет о ней рассказать читателям Хабра, то я буду очень рад. Вообще обработка данных это отдельная большая тема. Там свои премудрости и свои курьезы. Вот один из таких курьезов. При подготовке к к первой мастерской был выявлен "Феномен Чеченской Республики" (так мы назвали это явление) Некоторые онкологические показатели в Чечне были в сотни раз иногда в тысячи таз выше соседних регионов. Оказалось, что многие таблицы были свёрстаны в логике бумажного формата А4 и часто разбиты на две страницы. И этот "разрыв списка территорий" как раз приходился на строчку "Республика Чечня" и конвертер каждый раз номер страницы распознавал как цифры и по своей какой то дремучей логике добавлял две - три цифры номера страниц к какому ни будь онкологическому показателю в Чечне увеличивая его на 2- 3 порядка. Выявили, откорректировали, но перепуг был не шуточный. Конвертация данных, дело тонкое....
Кстати, да... интересная идея! Спасибо! Попробуем медвузам попредлагаться. Все же польза !
Спасибо за оценку. Будем стараться после третьей мастерской достичь еще более интересных результатов
Злободневненько. Анктуально. Вот листаю ХэдХантер и вижу вакансию "Аналитик" и понимаю что не стоит откликаться. К этому работодателю не нужно идти работать. Или написано "Системный аналитик", а в описании вакансии описан явный функционал аналитика данных. Тоже не буду откликаться. Нежелание некоторой части работодателей "вникать в тонкости" явным образом указывает на то, что и в работе тебя будут озадачивать чем угодно: "Иди сделай что говорят, или ты не тот, за кого себя выдаёшь"
Это не графики, это дашборды, Отличия от графиков в том, что пользователь имеет возможность сам выбирать интервалы времени, сортировать показатели, отфильтровывать заболеваемость мужскую, женскую., Выбирать возрастные группы, локализации опухоли. И в зависимости от его (пользователя) настроек меняются графики.
Инструмент с помощью которого все это сделано YandexDataLens. Кстати, он бесплатный. И есть для него курсы обучения, тоже бесплатные... Так что... Было бы желание
Совсем ничего что комментом. Спасибо за реакцию. Весьма отрадно что это читают и обращают внимание на такие детали. Я сейчас свяжусь с автором дашборда и попрошу прокомментировать или исправить или дать пояснение. Очевидно Вы имеете в виду правую диаграмму на первой вкладке.
Привет,@Mckar.Спасибо за оценку. Но про то что мы опоздали, так точно не соглашусь. Ведь эти данные будут актуальны всегда. Следующий после 2021 отчет 22-го года вышел в октябре 23-го. Когда у нас уже полным ходом шла мастерская. И мы конечно же продолжим этот проект, не только добавив туда данные 22-го, 23-го и всех последующих годов. Но так же и данные за предшествующие года начиная с 2007 го и отчасти с 1993 го.
The Show Must Go On !!!!
И кстати, буду очень признателен за ссылку на вторую часть отчета 22-го года. Пока что у меня есть только ссылка на "Состояние онкологической помощи в России в 2022" А второй части отчета там где Злокачественные новообразования в Росссии в 2022 У меня так пока что и нет. Так что буду очень признателен за ссылку