Pull to refresh
20
0
Алексей Приньков @prinkov

Software Developer | ML Engineer | Math

Send message

Почему-то нет фоток в комментах)
Хорошо, одна фотка в комментах и я напьюсь

Живая поддержка есть. Предлагаю ознакомиться со статьей =)

TLDR: рутина — боту, остальное — человеку. В идеале человеку только сложные чаты.

Да, вы правы, пальцы это весьма условно

Сел писать по вдохновению и выдал на память. В итоге перепутал группу и поле, спасибо за замечание

Вполне вероятно, что одно сводится к другому. Посмотрел несколько источников, в целом похожие определения. На самом деле, насколько мне известно, многие вещи и терминология в анализ временных рядов пришли из радиотехники, например, те же фильтры временных рядов.
Конечно же существует большое множество разных алгоритмов для выделения тренда, исключения сезонности. Думаю статья про такие алгоритмы может получиться интересной. Цель же данной статьи немного другая, а именно познакомить читателя с периодограммами и показать их возможное практическое применение.

Вообще-то всем известно, что считали они от слова обсчитывать. Ведь есть же нормальна таблица русов

Тоже первым делом об этой компоненте подумал)
Странное утверждение. Ведь в основе теорвера и статмода лежит в первую очередь матан и линал соответственно (это все-таки базовые направления из «математики»).

А если про частности, учитывая свой академический и рабочий опыт, встречал только обратные ситуации — не все те, кто хорошо разбираются в мат. анализе и лин. алгебре, могут освоить (или скорее даже осваивают) статистику и теорию вероятностей. Но в то же время все кто хорошо разбираются в статистике или теорвере хорошие спецы в лин. алгебре и матане.

Да, действительно, для подготовки данных и первичного анализа, как в статье, можно обойтись и без математического бэкграунда. Как и во многих задачах BI, достаточно хорошего учебника а-ля «Статистика для экономистов» Princeton University, но про статистику и математику ИМХО не согласен.
Безусловно, есть очень много утилит, программ и скриптов, решающих данную проблему. В то же время, не стоит забывать, что ключевым контекстом в статье является описываемый ETL процесс и данные операции рассматриваются как небольшая часть одного большого непрерывного процесса, где одни действия и данные зависят от других.

С технической стороны, если используется конкретный фреймворк (в нашем случае Apache Airflow), то куда логичнее использовать его стандартные средства и архитектуру (сенсоры, операторы).

Вероятно, при необходимости можно построить ETL процесс в Airflow с использованием Fetchmail+procmail оптимальнее (зависит от критерия) представленного. Но будет ли он проще, чем использование стандартной библиотеки вопрос открытый. С удовольствием посмотрел бы на такую реализацию.

Information

Rating
Does not participate
Location
Санкт-Петербург, Санкт-Петербург и область, Россия
Works in
Date of birth
Registered
Activity