
Комментарии 11
SQL и Excel заканчиваются там, где начинается сложная математика, автоматизация или работа с большими данными и тут в игру вступает Python.
Неверно. SQL значительно превосходит возможности Python в работе с большими данными. Терабайты для SQL не проблема.
Бедный R, никто его не любит, никто не приголубит...
Блин, а вот на R реально кто-то пишет? Я просто пока таких людей не встречал. Зачем он вообще нужен при живом Python?
Статистика в медицине и биологии (то, что называют "биоинформатика") - примерно 50/50% между Python и R.
Хотя вот сырые данные, геномные/изображения/карты плотностей/выгрузки с приборов, все же чаще обрабатывают в Python
Для R (surprise-surprise!!!) гораздо больше всяких хитровыделанных библиотек для деятельности а-ля рассчет коэффициента имени Пупкина для diffused-tie сетей. Ну и визуализация в аре сильно веселее естественно
Сила R в трубах ( %>% )
R это стильно, тот кто распробовал dplyr + ggplot2 уже не пойдет matplotlib грызть.
Для продуктовой аналитики хорошо, расчеты, визуализация, фильтрация, очень вкусный синтаксис.
augment(model2, sut476) %>%
ggplot(aes(x=time, color=strain, group=strain)) +
geom_point(aes(y=log_norm_count), alpha=0.5) +
geom_line(aes(y=.fitted))

Начинали с постановки 4-х вопросов, однако завершили ответом тока на 2 из них...
Профессионалы:-)
Прежде всего обладать знаниями математической статистики и теории вероятностей, как пользователь уметь работать с инструментами типа Excel и пакетами прикладных программ. Разработчиком же самих инструментов аналитик вовсе быть НЕ обязан (это к Python'у), так как это работа и функции других специалистов. Знание теории РБД и SQL будет плюсом для самостоятельного получения необходимых данных, хотя по специфике и сложности это работа тоже другого специалиста, который может выполнять ее по просьбе аналитика.
Инструментарий аналитика данных: что реально нужно освоить в 2026 году