Обновить

Инструментарий аналитика данных: что реально нужно освоить в 2026 году

Уровень сложностиПростой
Время на прочтение5 мин
Охват и читатели13K
Всего голосов 10: ↑10 и ↓0+10
Комментарии11

Комментарии 11

SQL и Excel заканчиваются там, где начинается сложная математика, автоматизация или работа с большими данными и тут в игру вступает Python.

Неверно. SQL значительно превосходит возможности Python в работе с большими данными. Терабайты для SQL не проблема.

Ну удачи анову гонять на SQL)

Бедный R, никто его не любит, никто не приголубит...

Кстати об R, ну не прям никто, но я очень редко встречаю людей, кому он нравится и кто им реально пользуется 🤔но они точно есть, это скорее альтернатива, а не обязательный инструмент

В Гугле пользуются точно, в России это скорее для дата сайентистов приблуда к сожалению

Блин, а вот на R реально кто-то пишет? Я просто пока таких людей не встречал. Зачем он вообще нужен при живом Python?

Статистика в медицине и биологии (то, что называют "биоинформатика") - примерно 50/50% между Python и R.
Хотя вот сырые данные, геномные/изображения/карты плотностей/выгрузки с приборов, все же чаще обрабатывают в Python

Для R (surprise-surprise!!!) гораздо больше всяких хитровыделанных библиотек для деятельности а-ля рассчет коэффициента имени Пупкина для diffused-tie сетей. Ну и визуализация в аре сильно веселее естественно

Сила R в трубах ( %>% )

R это стильно, тот кто распробовал dplyr + ggplot2 уже не пойдет matplotlib грызть.

Для продуктовой аналитики хорошо, расчеты, визуализация, фильтрация, очень вкусный синтаксис.

augment(model2, sut476) %>% ggplot(aes(x=time, color=strain, group=strain)) + geom_point(aes(y=log_norm_count), alpha=0.5) + geom_line(aes(y=.fitted))

Пример визуализации и синтаксиса
Пример визуализации и синтаксиса

Больше примеров

Начинали с постановки 4-х вопросов, однако завершили ответом тока на 2 из них...

Профессионалы:-)

Прежде всего обладать знаниями математической статистики и теории вероятностей, как пользователь уметь работать с инструментами типа Excel и пакетами прикладных программ. Разработчиком же самих инструментов аналитик вовсе быть НЕ обязан (это к Python'у), так как это работа и функции других специалистов. Знание теории РБД и SQL будет плюсом для самостоятельного получения необходимых данных, хотя по специфике и сложности это работа тоже другого специалиста, который может выполнять ее по просьбе аналитика.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации