Как стать автором
Обновить
32
0
Мария @m-pilipenko

Data Analyst

Отправить сообщение
Русскоязычные мануалы по NiFi — бесценны. Спасибо!
Кто на что учился.

И от меня спасибо )


Не подскажите ресурсы для мониторинга настроений рынка? Может также есть что порекомендовать инвестору-новичку для развития.


Буду благодарна )

Отнюдь. Нельзя назвать вымирающим то, что очень активно развивается.

В этом году R ворвался в ТОП 10 языков программирования.
Спасибо. Пост с душой и безусловной любовью к своему делу. Очень круто!

Если Вам удастся отправить таки письмо, будьте добры, передайте и мое послание:

«Дорогая Я-20, не волнуйся о будущем, все сложится. Ты будешь долго искать себя. И ты даже решишь, что IT не для тебя. Но выученное в процессе поисков — твой капитал. Он приведет тебя к мечте.
Прошу только одно — не отказывайся от возможности беззаботно потусить в универе, иногда прогулять пары и завязать дружбу на всю жизнь. Не жертвуй общением с миром, его цена равна мечте.
Твоя малообщительная Я из 2020.»

Буду благодарна :)

Мы выбирали с упором на мощность и удобства работы с биг дата. У нас NiFi используют и девопсы и админы и я со своей аналитикой )
Конечно!) только им нужна отдельная статья, на днях выпущу :)
То есть, мы по факту выпустили релиз кода, но при этом нигде это не отразилось?

Не совсем. Как я и говорила в статье, NiFi не про разработку, а про архитектуру. В последней часто происходят изменения. Меняются ip, версии сервисов, которые мы дергаем и т.д. Такие правки обычное дело, но менять из-за них каждый раз код, согласитесь, напрягает. Лучше вынести в NiFi.

Вам кажется, что вы видите свои процессы в виде картинки — а потом выясняется, что для реального понимания, как они работают, нужно посмотреть какое-то свойство у квадратика или стрелочки.

Для этого существует документирование. Внятные названия процессоров и каменты маст хев. Также разбивка на группы процессов поможет не потеряться.
Да, подкупила визуализация процесса. Это, можно считать, его бэкенд. А все мои аналитичиские штучки делаются уже отдельно скриптом )
Благодарю :) Пофиксила!
В этом году R ворвался в десятку самых популярных языков в мире (пруф).

Знание R, JavaScript и других ЯП нужны всего лишь 17% работодателям.

Да плевать работодателям каким способом вы решите задачу. Зачастую пишут: знание Python / R.

Смысл есть учить, то что нравиться.
Хорошая статья, спасибо.

Понравился график, но я бы добавила туда показатели суточной калорийности и активности. Весьма любопытно понаблюдать за собой с точки зрения аналитики.

Большой + за:
думать надо не о «диете», на которой посидел и забросил, а об образе жизни

К слову, в свое время, для меня эффективным оказалось увеличение количества приемов пищи с уменьшением порций + обязательный завтрак. По сути разгоняешь метаболизм и при этом привыкаешь кушать мало. По факту -15 кг за 3 мес незаметно и с удовольствием.

И да, важно принять — это не диета, а образ жизни.
Разворачивала локально, но на Ubuntu Server в VirtualBox, т.к нету вендовой версии. Выделяла 8 гб оперативки, этого оказалось вполне достаточно. Хотя документация советует 16 гб. Работает датайку в браузере.
Согласна, в идеале из датайку можно и не выходить. Тут уже вопрос ресурсов и мощности машины.
А что касается визуализации, то любая готовая платформа ставит нас в некие рамки. Работая с R, чувствую себя свободной, в этом плане.
Была не права. Т.к. датайку для импорта принимает сжатые файлы, я базу так и не распаковала. Ноябрьский файл был 5 Гб в сжатом виде.
Не уверена, что будет правильно и законно выкладывать такую базу, но могу попробовать скачать новую версию и посмотреть чем они отличаются.
Все локально. Была виртуалка с линуксом, на ней необходимый стек и база раздач.
В первое время для работы с виртуалкой выделяла 4 Гб озу, т.к. ноут мой именно средненький — с 6 Гб оперативки всего и установленной виндой. В таких условиях подготовка данных в датайку занимала порядка 2 часов, но надо признать, иногда вылетала.
Позже, когда добавила на ноут оперативки, смогла выделить на виртуалку 8 Гб. Теперь подготовка такого обьема занимает полчаса. + удалось увеличить размер отображаемого семпла до 300 000 строк (ранее получалось работать с не более 10 000)
А чтобы датайку не вылетала можно уменьшать размер семпла, для парсинга не обязательно отображение всего сета. На конечный результат это не влияет.
Обновила статью и показала детальнее этап формирования recipe )
В распакованном виде — 5 Гб.

Как правило, тем, кому не заходит математика — легко дается статистика и, особенно легко, теория вероятности. Парадокс, но сама видела, и не раз, такую ситуацию. Надо пробовать.

Да, с карантином работы у аналитиков прибавилось )
Хорошая идея, ждем обновления базы.

Информация

В рейтинге
Не участвует
Зарегистрирован
Активность