Как стать автором
Обновить
28.33

R *

Язык для статистической обработки данных

Сначала показывать
Порог рейтинга
Уровень сложности

На берегу океана или о тестах для таблиц 2*k

Уровень сложностиПростой
Время на прочтение2 мин
Количество просмотров592

Сообщение посвящено простому (всего 1 функция ) пакету chisquare, который реализует статистический тест на равенство пропорций для таблиц 2*k, выдает по ней подробную информацию, а также приятно оформленные таблицы в виде графиков

Читать далее
Всего голосов 1: ↑1 и ↓0+1
Комментарии0

Как биостатистика помогала в пандемию COVID-19

Время на прочтение11 мин
Количество просмотров1.3K

В этой статье расскажем о проекте, реализованном во время первой и второй волн пандемии COVID-19. Сегодня его идеолог и основной разработчик — Евгений Бакин — учится в магистратуре в ИТМО на программе Public Health Sciences (мы писали о ней в блоге). Проект реализовывался вне стен университета, но, во‑первых, он интересен сам по себе — математические методы, примененные к стандартным анализам крови, на пике заболеваемости COVID-19 немного упорядочили хаос для врачей и помогли спасти жизни людей. А во‑вторых, проект и подтолкнул специалиста в магистратуру. Пандемия имела огромные социально‑экономические последствия и повлияла на систему здравоохранения — Евгений заинтересовался более высокоуровневым взглядом на проблему.

Читать далее
Всего голосов 6: ↑5 и ↓1+4
Комментарии6

Как IT-специалисты-экологи спасут планету

Время на прочтение6 мин
Количество просмотров3.7K

Всем привет! Я тот самый человек, который учится на бакалавриате по направлению "Экология и природопользование" в обычном Российском ВУЗе. И будучи человеком, которому трудно утолить жажду знаний, мне приходится часто себя ловить на мыслях об улучшении и оптимизации многих процессов, в том числе и в образовании. В целом, образовательная программа моего ВУЗа достаточно неплоха, и мы получаем от преподавателей (конечно же, не от всех) информацию из научных кругов, говорим о инновационных исследованиях и приборах, которые дают новый толчок в изучении такой многокомпонентной науки как экология.

Я думаю, не трудно догадаться, что в современных реалиях все завязано на IT, в том числе и экология. Все меньше становится природных процессов, в которых не используются информационные технологии. Честно, даже затрудняюсь привести такой пример. И вот тут возникает реальная проблема подготовки квалифицированных кадров, которые должны отвечать современным требованиям. И я тут даже не про работодателей, а про жизнь – обычную человеческую бытовуху. Мир меняется бешенными темпами — это факт. Природные процессы меняются, как и мы с вами – также стремительно и безвозвратно. Научное сообщество даже не сразу успевает эти изменения детектировать и осмыслять, поэтому вопрос поиска и подготовки специалистов на стыке нескольких наук не менее актуальная проблема чем изменение климата.

С вашего позволения я попытаюсь рассмотреть некоторые проблемы и пути решения подготовки айтишников-экологов/экологов-айтишников, а также ответить на вопрос как IT-специалисты-экологи спасут планету.

Читать далее
Всего голосов 18: ↑11 и ↓7+4
Комментарии10

R — движок для биоинформатики и датасайнс

Уровень сложностиПростой
Время на прочтение3 мин
Количество просмотров3.2K

R — это не просто язык программирования, это лингва-франка для многомиллионного сообщества статистиков, биоинформатиков, датасаентистов. Обсудим несколько знаковых инструментов в R: их историю и зачем они нужны.

Читать далее
Всего голосов 10: ↑7 и ↓3+4
Комментарии6

Истории

Зачем учить R в 2023 году?

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров8.9K

Всем привет, я Дмитрий Володин, Analytics Engineer из TrafficStars. Сегодня я хочу немного порефлексировать на тему спроса на R и целесообразности его изучения.

Текст будет выражать личный опыт и мнение, я не буду проводить аналитическую работу по сравнению средних зарплат и количества вакансий на разных языках. Скорее поделюсь своими мыслями. И постараюсь оставаться не предвзятым по максимуму.

Читать далее
Всего голосов 15: ↑12 и ↓3+9
Комментарии6

Подключаемся к Notion API при помощи R

Время на прочтение5 мин
Количество просмотров3.3K

Этот небольшой пример того, как начать работу с Notion API. Вся документация находится здесь

Для начала работы с Notion API и нужно выполнить несколько шагов:

Читать далее
Всего голосов 4: ↑4 и ↓0+4
Комментарии0

Элементы функционального программирования в R

Время на прочтение13 мин
Количество просмотров1.9K

"На небе только и разговоров, что о функциональном программировании."

Всем привет. Меня зовут Дмитрий Володин, я Analytics Engineer в TrafficStars. Сегодня я хочу рассказать вам о приёмах ФП в R. Исходить я постараюсь из более-менее реальных задач, а не учебных, чтобы показать, что элементам ФП вполне есть место в вашем ящике с инструментами.

Читать далее
Всего голосов 12: ↑11 и ↓1+10
Комментарии2

Новое повсюду или статистические тесты эквивалентности

Уровень сложностиСредний
Время на прочтение5 мин
Количество просмотров1.5K

Классические статистические тесты – это, как правило, тесты, проверяющие гипотезу о равенстве (медианы определенному значению, средних в двух независимых группах, дисперсии во многих зависимых группах, коэффициента корреляции нулю и т.д.).

Однако существует и альтернативный подход - так называемая группа тестов эквивалентности, которая проверяет гипотезу о том, находится ли наблюдаемая разница / значение в интервале незначимости

В статье приведен обзор пакета negligible на R, который реализует данные статтесты. Обзор сопровождается примерами применения данной группы тестов на встроенных базах данных

Читать далее
Всего голосов 5: ↑5 и ↓0+5
Комментарии2

Запуск R кода по расписанию

Уровень сложностиПростой
Время на прочтение14 мин
Количество просмотров1.9K

Всем привет. Меня зовут Дмитрий Володин, я Analytics Engineer в Trafficstars. Когда‑то я, как и все, был начинающим аналитиком данных на R и передо мной на этом этапе остро встал вопрос запуска моего кода по расписанию. Ещё желательно было иметь возможность запускать откуда угодно. А уж запускать «кнопочкой play» вообще казалось мечтой.

Эта статья нацелена на начинающих аналитиков данных (не обязательно на R). Также она может быть полезна и опытным аналитикам. Особенно если плохо с коммуникацией с разработчиками и инфраструктурщиками (или их просто нет у вас в компании). Я пересказываю свой опыт, но кажется, он будет весьма полезен читателям.

Читать далее
Всего голосов 13: ↑13 и ↓0+13
Комментарии0

Заметки по R: находим каждый последний понедельник месяца в наборе данных

Уровень сложностиПростой
Время на прочтение3 мин
Количество просмотров1.2K

Периодически возникают задачи в R, которые просты по своей сути, но не очевидны для тех, кто только начинает свой путь.

Представим, что в нашей организации каждый последний понедельник месяца происходит учет товара. В эти дни нет продаж. И мы бы хотели учесть это в наших прогнозах. Стоит вопрос: как в данных "выловить" эти понедельники, не используя function.

Читать далее
Всего голосов 2: ↑2 и ↓0+2
Комментарии2

Сжимаем временной ряд в светофор

Время на прочтение3 мин
Количество просмотров3.1K


«Мы сделаем вас счастливыми! Вы будете счастливыми!»
«Отроки во Вселенной» (1974)


Менеджеры в большинстве компаний хотят примерно одного и того же. Чтобы сложные вещи объяснялись простым языком, а все можно было свести к спидометрам, градусникам и светофорам.


Аллегория вполне понятная, пытаться объяснять что-либо — в 99% случаев процедура бессмысленная и энергозатратная. Поэтому ниже пример, как двумя экранами кода можно быстренько превратить временные ряды, которые почти всегда встречаются в больших количествах, в светофор.


Все предыдущие публикации.

Читать дальше →
Всего голосов 6: ↑6 и ↓0+6
Комментарии2

Как врач сделал себе ИИ помощника. Часть 2

Время на прочтение3 мин
Количество просмотров3.6K

Первая часть собрала хорошую "кассу" в виде рейтинга и кармы, но самое главное вызвала интерес аудитории. Последний факт стал решающим критерием для написания продолжения. Очень часто, 2-я часть хуже первой, но я все же решил рискнуть. Представлюсь снова, меня зовут Александр и я врач-гематолог. Я работаю над приложением по интерпретации общего анализа крови (ОАК) с помощью алгоритмов машинного обучения (МО). После публикации первой заметки о проекте я внимательно изучил комментарии своих читателей. Сразу скажу - практически все из них были конструктивными и понятными. Спасибо всем! Это подстегнуло перенести проект в список приоритетных и поработать над обновлением. Кому не терпится, могут сразу переходить по ссылке. Бот работает в тестовом режиме. Ниже я кратко и подробно расскажу, что изменилось.

Читать далее
Всего голосов 19: ↑18 и ↓1+17
Комментарии15

Как врач сделал себе ИИ помощника. Часть 1

Время на прочтение3 мин
Количество просмотров12K

Всем привет, меня зовут Александр и я врач-гематолог. Для справки, это тот, кто занимается болезнями крови. Мой общий стаж перевалил за 16 лет, я кандидат медицинских наук и последние пару-тройку лет интересуюсь анализом данных, machine learning и ИИ в медицине. Под "интересуюсь" я подразумеваю исследования и публикации по этим темам, а также обучение и саморазвитие.

Так как я ни разу не программист, то мой пост будет не про это. Тем не менее последние пару лет моим рабочим инструментом является R. Это не тот язык программирования, на котором можно писать крутые сайты или приложения, но кое-что он все-таки умеет. R - больше про анализ данных, чем я и занимаюсь. Сегодня я хочу кратко рассказать и показать один из моих проектов на R, который решает вполне конкретную прикладную задачу - интерпретацию общего анализа крови.

Общий анализ крови (ОАК) – самый частый и один из самых сложных анализов человека для интерпретации, что обусловлено большим числом входящих в него параметров. Как правило, именно этот анализ является скрининговым тестом как для гематологов амбулаторного приема, так и для врачей общей практики и других специальностей. Объемы выполняемых анализов исчисляются сотнями тысяч. Моя идея не нова - машинная помощь в правильной и быстрой интерпретации общего анализа крови, которая будет содействовать развитию качественной, доступной и своевременной диагностики онкогематологических заболеваний. Зачастую врач первичного звена (терапевт) не может дифференцировать изменения в ОАК, что приводит либо к гиподиагностике, либо к повышенной настороженности и излишне частому направлению на консультацию к врачу-гематологу. Ситуацию усугубляют огромные объемы анализов, выполняемые в рамках профилактических и лечебно-диагностических процессов как в государственном, так и в частном секторе здравоохранения. Расшифровка анализов онлайн - один из востребованных запросов в Интернете. Меня часто просят об этом в социальных сетях.

Читать далее
Всего голосов 78: ↑74 и ↓4+70
Комментарии67

Ближайшие события

Weekend Offer в AliExpress
Дата20 – 21 апреля
Время10:00 – 20:00
Место
Онлайн
Конференция «Я.Железо»
Дата18 мая
Время14:00 – 23:59
Место
МоскваОнлайн

Мультиканальная атрибуция в EdTech: ожидание/реальность или что мы вынесли из этого опыта

Время на прочтение5 мин
Количество просмотров2.2K

В какой-то момент у нас в компании стали приходить запросы от маркетологов, чтобы мы поглубже изучили взаимодействие маркетинговых каналов и попробовали мультиканальные модели атрибуции.

Что и в какой последовательности мы делали, чтобы мультиканальная атрибуция появилась на свет

Обзор инструментов, которые мы использовали

Что в этом опыте оказалось полезным, а что можно было вообще не делать

В этой статье я хочу поделиться:

Читать далее
Рейтинг0
Комментарии0

Теория квантовых состояний: из жизни в код

Время на прочтение5 мин
Количество просмотров2.9K

Расскажу вам о моём вИдении правильного программирования любых систем.

Кратко о себе: программист самоучка, примерно в 1992 году начинал с ассемблера, крякая через HIEW (Огромное СПАСИБО автору этого замечательного дизассемблера) всякие DOS-игрухи-проги, и прогая всё, что в голову взбредёт - от игр до вирей (домашних и добрых).

Подробнее о "Теории квантовых состояний" >
Всего голосов 28: ↑13 и ↓15-2
Комментарии4

Спросим у Google, насколько наша встреча была предначертана судьбой

Время на прочтение17 мин
Количество просмотров23K

Введение


Когда я познакомилась со своим бойфрендом, я иногда ощущала небольшое сожаление от того, что у нас не было умилительной киношной истории встречи, несмотря на то, что мы пять лет жили в одном и том же городе и учились в одном университете. Наша история не уникальна для многих пар в 2020 году: на спаде между двумя волнами COVID мы начали общаться онлайн, в приложении для знакомств Bumble.

Я подумала, что благодаря истории местоположений Google, втихомолку отслеживающей данные GPS, можно было бы найти ответ на вопрос о том, насколько судьбоносно пересекались наши дорожки до встречи. Насколько близко мы были к тому, чтобы воспроизвести романтическую сцену «среди десятков людей они нашли глазами друг друга»?
Читать дальше →
Всего голосов 92: ↑90 и ↓2+88
Комментарии22

RStudio, R Markdown, Latex и отчеты в PDF формате. Мой опыт

Время на прочтение8 мин
Количество просмотров3.8K

RStudio, R Markdown, Latex и отчеты в PDF формате. Мой опыт.

Сегодня я хочу рассказать о том, как я писал отчеты на R, с чем сталкивался и как решал проблемы, которые возникали по ходу разработки. Отчеты были в формате PDF и запускались из Python в Camunda.

Читать далее
Всего голосов 3: ↑3 и ↓0+3
Комментарии4

Важно ли DS аналитику знать про software development?

Время на прочтение12 мин
Количество просмотров4K


— Иван Иваныч Иванов с утра ходит без штанов!
— А Иванов Иван Иваныч одевает штаны на ночь!
«Афоня» (1975)


Множество курсов, призванных подготовить DS специалистов «за полгода», создают впечатление, что уж сертифицированным датамайнером стать достаточно просто. А что? Немного основ DS языка, немного по структуре данных, немного по различным преобразованиям данных, немного SQL, немного математики (в ML не погружаемся, только знакомимся), немного визуализации, немного HTML+JS+CSS. Специалист готов?


На практике оказывается, что маловато будет.


Все предыдущие публикации.

Читать дальше →
Всего голосов 8: ↑8 и ↓0+8
Комментарии2

Визуализируем в R данные мониторинга температуры процессора Raspberry PI Zero W

Время на прочтение3 мин
Количество просмотров3K

Визуализируем данные мониторинга температуры Raspberry PI в R c помощью ggplot2 и отправляем в телеграм через телеграм-бота. Все R-скрипты выполняются на самом Raspberry PI Zero W c предварительно установленным R 4.2.1 и необходимыми пакетами.

Читать далее
Всего голосов 2: ↑2 и ↓0+2
Комментарии0

Логистическая регрессия с помощью tidymodels

Время на прочтение9 мин
Количество просмотров2.4K

В последнее время я публикую заметки, которые демонстрируют работу с пакетом tidymodels . Я разбираю как простые, так и более сложными модели. Сегодняшняя заметка подойдет тем, кто только начинает свое знакомство с пакетом tidymodels

Читать далее
Всего голосов 8: ↑8 и ↓0+8
Комментарии2
Изменить настройки темы

Вклад авторов

Работа

Data Scientist
60 вакансий