Pull to refresh
14
0
Дмитрий Бабаев @ratatosk

Machine Learning Practitioner

Send message

Из материалов на английском есть еще по теорверу очень доступный курс https://projects.iq.harvard.edu/stat110

И еще книги Kalid Azad https://betterexplained.com/ очень хорошо подходят для начального погружения в математику

Интересно, а чтобы стартовать с весов Квена, взяли его токенизатор? Или как то придумали как их использовать со своим токенизатором?

Статья очень интересная, много классных идей! Вот бы еще репорт в формате ресерч статьи.

Triton — это новый язык программирования, который обеспечивает гораздо более высокую производительность, чем CUDA

Triton это не язык программирования, а сервер для инференса и работает он поверх CUDA

На завершающем этапе применяется идея бустинга. Решающие деревья формируют комитет для голосования. На основании коллективного мнения создается наиболее правдоподобный ответ. Главное достоинство бустинга – это возможность при объединении множества «плохих» алгоритмов (результат которых лишь немного лучше случайного) получить сколь угодно «хороший» итоговый результат.

Возможно речь все-таки не о бустинге а о бэггинге?

Довольно забавно, что в вашем комментарии можно заменить слово китаец, на слово русский, и, он останется, во многом, верным. Тем не менее, мы находимся там где мы сейчас.

Люди, работающие с R, должны знать статистику, а люди, знающие статистику, должны знать, что то, чем вы занимаетесь в этой статье называется систематической ошибкой отбора.

Вы отобрали примеры, когда R лучше Python, проигнорировав случаи где все наоборот, и, никак не учли актуальность ваших примеров.

Приведу только один пример, который для меня является решающим в выборе R vs Python. 99% нейросетевого коммюнити использует Python, и, работая с R, исследователь оказывается в изоляции, не может использовать код из свежих (и не очень свежих) статей, и, имеет огромные проблемы при взаимодействии с коллегами.

Так как код выложен под лицензией Apache патенты никак не ограничивают.

Contributors provide an express grant of patent rights. См. раздел 3. Grant of Patent License. в лицензии Apache.

Описанное в статье очень похоже на идеи математической вселенной Тегмарка https://en.wikipedia.org/wiki/Our_Mathematical_Universe

В том, что надо в долларах а не в рублях смотреть: https://www.irn.ru/gd/s-2000-goda-v-dollarah/

Возможно, будет интересно посмотреть нашу статью, про эмбеддинги последовательностей событий, где каждое событие состоит из категриальных и численных полей: https://arxiv.org/abs/2002.08232.

Есть еще PyJNIus (https://github.com/kivy/pyjnius) он работает через JNI, он удобнее и быстрее чем Py4J

В чем смысл сравнивать количество умерших от гриппа в 2016 году и смертей от COVID? Явно же заболевших гриппом было сильно больше.

Так отрасль на подъеме, людей не хватвет, поэтому начинающему легко попасть на относительно неплохую стартовую зарплату. Правильно ли я понимаю, что вы хотите, чтобы отрасль была на спаде и программисты дрались друг с другом за рабочие места?

В многомировой интерпретации множество миров где кот мертв естественным образом получаются вследствие того, что при очередном делении на два мира тот мир, где кот остался жив может еще раз поделиться на два мира жив/мертв. Получается, что с течением времени растет количество миров, где кот мертв, а мир, где кот жив остается один.

А в чем смысл шифровать DNS, кроме как, защиты от подмены ответа? Провайдер же все равно знает IP соединения и, может по нему восстановить основную часть домена для более-менее крупных сайтов?

Рекуррентные нейросети полны по Тьюрингу, вот, например, подробности: https://stats.stackexchange.com/questions/220907/meaning-and-proof-of-rnn-can-approximate-any-algorithm.

Английский вариант этой книги доступен бесплатно от автора: https://jakevdp.github.io/PythonDataScienceHandbook/

1

Information

Rating
Does not participate
Location
Москва, Москва и Московская обл., Россия
Registered
Activity

Specialization

Data Scientist, ML Engineer