Comments / Profile of 1appleapple0 / Habr

Машинист бронепоезда

Subscribers

Я у мамы алготрейдер: ищем бесплатные фреймворки для тестирования гипотез и запуска в боевом режиме (Python)

1appleapple0 Dec 28 2018 at 09:41

Добрый день, и спасибо за развёрнутый комментарий.
Абсолютно согласен с возможностью алготрейдига с помощью указанных программных решений, которые на рынке известны и широко используются. Ключевым отличием является их поставка «под ключ», т.е. это не самостоятельная работа (DIU) на бесплатных библиотеках и python’e (о чем я упоминал до ката как о вводной для статьи), а готовые коробочные решения с интерфейсами и своими наборами возможностей, ограничений и тарифов. Безусловно, если убрать привязку к DIY и Python, а также расширить бюджет с 0 рублей в месяц до ***, то их нужно включать в обзор и говорить как о наиболее распространённом софте для алготрейдинга. Ещё раз спасибо!
Ну и по поводу IB — их терминал мне хорошо известен и, конечно, там есть определенный функционал для алго (не супер удобный, но всё же), просто к нему применяются те же ограничения и невыполняются условия, которые были мною обозначены в прошлом абзаце и в качестве исходных вводных.

Я у мамы алготрейдер: ищем бесплатные фреймворки для тестирования гипотез и запуска в боевом режиме (Python)

1appleapple0 Dec 28 2018 at 09:33

Приветствую, спасибо за отзыв!
Об этом тоже обязательно будет, но какой бы конкретный кейс не хотелось рассмотреть, сначала необходимо разобраться с «инфраструктурой»: где тестировать, на каких данных и так далее, иначе прикладные вещи не проверить.

Я у мамы алготрейдер: ищем бесплатные фреймворки для тестирования гипотез и запуска в боевом режиме (Python)

1appleapple0 Dec 25 2018 at 07:12

Да, спасибо, ночная опечатка))

VotingClassifier в sсikit-learn: построение и оптимизация ансамбля моделей классификации

1appleapple0 Nov 24 2018 at 14:13

Ваши товарищи, уважаемый, явно в кружке с Фомой неверующим.
Если бы я хотел перевести документацию, то перевел бы.
Вот исходник, который я использовал для участия в соревновании, и на основании которого писал статью, собрав GridSearch через общий пайплайн просто для наглядности использования метода VotingClassifier.
Вам могли не понравиться ни статья, ни методы, использованные в ней, но обвинять в копи-пасте, видя метку «из песочницы», где нельзя было указывать изначально ссылки и т.д. — очень необъективно.

VotingClassifier в sсikit-learn: построение и оптимизация ансамбля моделей классификации

1appleapple0 Nov 18 2018 at 19:21

Во-первых спасибо за время, уделенное прочтению статьи!

Относительно дискуссии о корректности приведенных высказываний, я не берусь от частного переходить к общему, потому что согласен с Вами — частный случай никоим образом не должен претендовать на универсальную теорию.

Более того, рассуждать о том, насколько уместно «везде» использовать методику построения ансамблей я тоже не возьмусь, но хочу обратить Ваше внимание на ряд моментов:
— как верно высказался roryorangepants, в данной статье речь шла о, так скажем, соревновательном Data Science, который чаще всего встречается на kaggle competitions, и там очень часто (если не всегда) наилучший результат показывают ensemble модели, часто гораздо более сложные, чем приведенная в статье.
— несмотря на то, что целью данной статьи не было обосновать сам факт выбора ансамбля как оптимального подхода, а рассмотреть скорей специфику использования конкретного модуля из библиотеки skicit, в качестве теоретической базы для обоснования могут служить статьи Thomas G Dietterich: Ensemble Methods in Machine Learning , где в качестве заключения автор делает вывод о том, что:

Ensembles are well established as a method for obtaining highly accurate classiers by combining less accurate ones

, что в целом соответствует высказываниям, сделанным мною в тексте.
— в качестве доказательства распространенности подхода можно использовать статью «История развития ансамблевых методов классификации в машинном обучении» Юрия Каштинского, где приводится история вопроса и даются перечни работ, посвященных изучению «правильности» выбранного подхода.
— из всем известного курса Andrew Ng, а также по ссылке, которая дана в тексте на курс Open Data Science блог также следует, что практика объединения более слабых отдельно-взятых классификаторов для получения «улучшенного» объединенного набирает обороты и является если не стандартом, то уже зарекомендовавшим себя подходом.
— не берусь добавить к вышеуказанным статьям и ресурсам свое сильно субъективное мнение, но, учитывая что я больше практикуюсь в построении моделей для изучения финансовых рынков, хорошим подспорьем может служить также недавно вышедшая статья: Online Ensembles for Financial Trading, где утверждается, что

Diverse behavior of models on predicting complex dynamic systems: in problems with so many unrecorded factors inﬂuencing the dynamics of a systemis hard to ﬁnd a predictive model that is good for all regimes.

и исходя из этого, часто более практичным даже в решении прикладных задач с онлайн-обновляющимися данными является использование как раз нескольких моделей в виде ансамбля, что позволяет в целом повысить надежность предсказания.

В завершении хочу повторно сказать спасибо за высказанные мнения и замечания и все же уточнить, что статья скорей посвящена конкретному кейсу и должна была скорей ответить на вопрос «как применить ансамбль, если уже решились», чем «стоит ли его применять и насколько этот подход лучше других». Спасибо !)