Pull to refresh
3
0
Vladimir Bogdanov @1appleapple0

Машинист бронепоезда

Send message
Добрый день, и спасибо за развёрнутый комментарий.
Абсолютно согласен с возможностью алготрейдига с помощью указанных программных решений, которые на рынке известны и широко используются. Ключевым отличием является их поставка «под ключ», т.е. это не самостоятельная работа (DIU) на бесплатных библиотеках и python’e (о чем я упоминал до ката как о вводной для статьи), а готовые коробочные решения с интерфейсами и своими наборами возможностей, ограничений и тарифов. Безусловно, если убрать привязку к DIY и Python, а также расширить бюджет с 0 рублей в месяц до ***, то их нужно включать в обзор и говорить как о наиболее распространённом софте для алготрейдинга. Ещё раз спасибо!
Ну и по поводу IB — их терминал мне хорошо известен и, конечно, там есть определенный функционал для алго (не супер удобный, но всё же), просто к нему применяются те же ограничения и невыполняются условия, которые были мною обозначены в прошлом абзаце и в качестве исходных вводных.

Приветствую, спасибо за отзыв!
Об этом тоже обязательно будет, но какой бы конкретный кейс не хотелось рассмотреть, сначала необходимо разобраться с «инфраструктурой»: где тестировать, на каких данных и так далее, иначе прикладные вещи не проверить.

Ваши товарищи, уважаемый, явно в кружке с Фомой неверующим.
Если бы я хотел перевести документацию, то перевел бы.
Вот исходник, который я использовал для участия в соревновании, и на основании которого писал статью, собрав GridSearch через общий пайплайн просто для наглядности использования метода VotingClassifier.
Вам могли не понравиться ни статья, ни методы, использованные в ней, но обвинять в копи-пасте, видя метку «из песочницы», где нельзя было указывать изначально ссылки и т.д. — очень необъективно.
Во-первых спасибо за время, уделенное прочтению статьи!

Относительно дискуссии о корректности приведенных высказываний, я не берусь от частного переходить к общему, потому что согласен с Вами — частный случай никоим образом не должен претендовать на универсальную теорию.

Более того, рассуждать о том, насколько уместно «везде» использовать методику построения ансамблей я тоже не возьмусь, но хочу обратить Ваше внимание на ряд моментов:
— как верно высказался roryorangepants, в данной статье речь шла о, так скажем, соревновательном Data Science, который чаще всего встречается на kaggle competitions, и там очень часто (если не всегда) наилучший результат показывают ensemble модели, часто гораздо более сложные, чем приведенная в статье.
— несмотря на то, что целью данной статьи не было обосновать сам факт выбора ансамбля как оптимального подхода, а рассмотреть скорей специфику использования конкретного модуля из библиотеки skicit, в качестве теоретической базы для обоснования могут служить статьи Thomas G Dietterich: Ensemble Methods in Machine Learning , где в качестве заключения автор делает вывод о том, что:
Ensembles are well established as a method for obtaining highly accurate classiers by combining less accurate ones
, что в целом соответствует высказываниям, сделанным мною в тексте.
— в качестве доказательства распространенности подхода можно использовать статью «История развития ансамблевых методов классификации в машинном обучении» Юрия Каштинского, где приводится история вопроса и даются перечни работ, посвященных изучению «правильности» выбранного подхода.
— из всем известного курса Andrew Ng, а также по ссылке, которая дана в тексте на курс Open Data Science блог также следует, что практика объединения более слабых отдельно-взятых классификаторов для получения «улучшенного» объединенного набирает обороты и является если не стандартом, то уже зарекомендовавшим себя подходом.
— не берусь добавить к вышеуказанным статьям и ресурсам свое сильно субъективное мнение, но, учитывая что я больше практикуюсь в построении моделей для изучения финансовых рынков, хорошим подспорьем может служить также недавно вышедшая статья: Online Ensembles for Financial Trading, где утверждается, что
Diverse behavior of models on predicting complex dynamic systems: in problems with so many unrecorded factors influencing the dynamics of a systemis hard to find a predictive model that is good for all regimes.
и исходя из этого, часто более практичным даже в решении прикладных задач с онлайн-обновляющимися данными является использование как раз нескольких моделей в виде ансамбля, что позволяет в целом повысить надежность предсказания.

В завершении хочу повторно сказать спасибо за высказанные мнения и замечания и все же уточнить, что статья скорей посвящена конкретному кейсу и должна была скорей ответить на вопрос «как применить ансамбль, если уже решились», чем «стоит ли его применять и насколько этот подход лучше других». Спасибо !)

Information

Rating
Does not participate
Registered
Activity