На завершающем этапе применяется идея бустинга. Решающие деревья формируют комитет для голосования. На основании коллективного мнения создается наиболее правдоподобный ответ. Главное достоинство бустинга – это возможность при объединении множества «плохих» алгоритмов (результат которых лишь немного лучше случайного) получить сколь угодно «хороший» итоговый результат.
Возможно речь все-таки не о бустинге а о бэггинге?
Довольно забавно, что в вашем комментарии можно заменить слово китаец, на слово русский, и, он останется, во многом, верным. Тем не менее, мы находимся там где мы сейчас.
Люди, работающие с R, должны знать статистику, а люди, знающие статистику, должны знать, что то, чем вы занимаетесь в этой статье называется систематической ошибкой отбора.
Вы отобрали примеры, когда R лучше Python, проигнорировав случаи где все наоборот, и, никак не учли актуальность ваших примеров.
Приведу только один пример, который для меня является решающим в выборе R vs Python. 99% нейросетевого коммюнити использует Python, и, работая с R, исследователь оказывается в изоляции, не может использовать код из свежих (и не очень свежих) статей, и, имеет огромные проблемы при взаимодействии с коллегами.
Возможно, будет интересно посмотреть нашу статью, про эмбеддинги последовательностей событий, где каждое событие состоит из категриальных и численных полей: https://arxiv.org/abs/2002.08232.
Так отрасль на подъеме, людей не хватвет, поэтому начинающему легко попасть на относительно неплохую стартовую зарплату. Правильно ли я понимаю, что вы хотите, чтобы отрасль была на спаде и программисты дрались друг с другом за рабочие места?
В многомировой интерпретации множество миров где кот мертв естественным образом получаются вследствие того, что при очередном делении на два мира тот мир, где кот остался жив может еще раз поделиться на два мира жив/мертв. Получается, что с течением времени растет количество миров, где кот мертв, а мир, где кот жив остается один.
А в чем смысл шифровать DNS, кроме как, защиты от подмены ответа? Провайдер же все равно знает IP соединения и, может по нему восстановить основную часть домена для более-менее крупных сайтов?
Из материалов на английском есть еще по теорверу очень доступный курс https://projects.iq.harvard.edu/stat110
И еще книги Kalid Azad https://betterexplained.com/ очень хорошо подходят для начального погружения в математику
Интересно, а чтобы стартовать с весов Квена, взяли его токенизатор? Или как то придумали как их использовать со своим токенизатором?
Статья очень интересная, много классных идей! Вот бы еще репорт в формате ресерч статьи.
Triton это не язык программирования, а сервер для инференса и работает он поверх CUDA
Возможно речь все-таки не о бустинге а о бэггинге?
Автопилот решил отбросить руль чтобы кожаный не мешал
Pied Piper?
Довольно забавно, что в вашем комментарии можно заменить слово китаец, на слово русский, и, он останется, во многом, верным. Тем не менее, мы находимся там где мы сейчас.
Люди, работающие с R, должны знать статистику, а люди, знающие статистику, должны знать, что то, чем вы занимаетесь в этой статье называется систематической ошибкой отбора.
Вы отобрали примеры, когда R лучше Python, проигнорировав случаи где все наоборот, и, никак не учли актуальность ваших примеров.
Приведу только один пример, который для меня является решающим в выборе R vs Python. 99% нейросетевого коммюнити использует Python, и, работая с R, исследователь оказывается в изоляции, не может использовать код из свежих (и не очень свежих) статей, и, имеет огромные проблемы при взаимодействии с коллегами.
У меня у нескольких коллег из Сбера заблочили
Так как код выложен под лицензией Apache патенты никак не ограничивают.
Contributors provide an express grant of patent rights. См. раздел 3. Grant of Patent License. в лицензии Apache.
Описанное в статье очень похоже на идеи математической вселенной Тегмарка https://en.wikipedia.org/wiki/Our_Mathematical_Universe
В том, что надо в долларах а не в рублях смотреть: https://www.irn.ru/gd/s-2000-goda-v-dollarah/
Возможно, будет интересно посмотреть нашу статью, про эмбеддинги последовательностей событий, где каждое событие состоит из категриальных и численных полей: https://arxiv.org/abs/2002.08232.
Есть еще PyJNIus (https://github.com/kivy/pyjnius) он работает через JNI, он удобнее и быстрее чем Py4J
В чем смысл сравнивать количество умерших от гриппа в 2016 году и смертей от COVID? Явно же заболевших гриппом было сильно больше.
Так отрасль на подъеме, людей не хватвет, поэтому начинающему легко попасть на относительно неплохую стартовую зарплату. Правильно ли я понимаю, что вы хотите, чтобы отрасль была на спаде и программисты дрались друг с другом за рабочие места?
В многомировой интерпретации множество миров где кот мертв естественным образом получаются вследствие того, что при очередном делении на два мира тот мир, где кот остался жив может еще раз поделиться на два мира жив/мертв. Получается, что с течением времени растет количество миров, где кот мертв, а мир, где кот жив остается один.
А в чем смысл шифровать DNS, кроме как, защиты от подмены ответа? Провайдер же все равно знает IP соединения и, может по нему восстановить основную часть домена для более-менее крупных сайтов?
Рекуррентные нейросети полны по Тьюрингу, вот, например, подробности: https://stats.stackexchange.com/questions/220907/meaning-and-proof-of-rnn-can-approximate-any-algorithm.
Английский вариант этой книги доступен бесплатно от автора: https://jakevdp.github.io/PythonDataScienceHandbook/