Pull to refresh
19
2
Send message

Так то кажется что есть 10500 различных низковесящих яблок которые можно улучшить у них

Ну их стартап активно развивается, судя по релиз нотс, но вот они уже не так активно что то опенсурсят

Ну, у мозга же есть какая то функция, то есть правильный ответ на этот вопрос существует


Выходит что очень глупо отметать какую то теорию если прошлые n были не верными

А есть где то код для воспроизведения? Очень хочется попробовать?

да вроде прогонял( Сразу извиняюсь за ошибки, сам их совсем не вижу. Но если вы посоветуете исправления, через Ctr + Enter можете подать их, сразу исправлю(

А можете как то более четко обосновать в чем причина проблем от оставления ссылки на личный блог посвященный тематике статьи? Я просто правда не понимаю почему это кого то задевает? Если это как то нарушает правила или делает кого-то жизнь настолько невыносимой, то я готов немедленно отредачить статью и убрать ссылку, но хотел бы хоть какие то аргументы. В правилах хабра прямым текстом написано что оставлять ссылки на персональные блоги можно (пункт 1, раздел "исключения")

расписано в пункте p.s. под статьей?

Не поленился, проанализировал те статьи что выходят на хабре. Из 10 не новостных технический статей в 7и был контакт пользователя (ютуб канал/телеграм канал итп), так что кажется что это уже база?

Видимо мне карму никогда не сливали

А вы считаете это неправильным? Вроде это правило хорошего тона оставлять контакт в статье

Отказались от HFI и стали запускать модельки сами

P40 - старье и не заведется с большинством современных решений.

А можете рассказать как вы паралелились между карточками, в случае когда вся модель не влезает на одну (то есть DP/DDP не подходят)? Сейчас бьюсь с deepspeed- но чет оч запарно все вызходит(((

Рад что вам понравилось)

Эта же штука не используют все нейроные ускорители, встроенные в процессоры, а грузит все на CPU

Все круто, но можно хоть слово про то что это вообще такое?

  • [V] просто токенизируется, тут не происходит нормировки его веса.

  • Всмысле чем отличается? Мы заставляем модель не забывать абстрактные признаки и получаем лучше результат. Если датасет для до обучения большой буст от его использования будет меньше, но все равно будет

Да, гугл уверял что гугл асистент даже не подает напряжение на микрофон пока вы не скажете команду Okey Google. Не знаю почему все так сильно параноят по собственной безопастности???

1

Information

Rating
1,252-nd
Registered
Activity