Pull to refresh

Comments 8

Обучение — на PyTorch + Ray, низкая точность за счет MXFP8-ядер для MoE; масштабирование — «на тысячи GPU» с expert-parallel и гибридным шардированием. Эти решения снижают коммуникационные издержки и ускоряют инференс без постквантизации

Вы перевели все-таки это предложение на русский язык …. «Кто на ком стоял? Извольте выражаться яснее …..»

Спасибо Вам за замечание, согласна, фраза получилась тяжеловесной. Когда писала, хотела придать солидности) Я заменю на “Модель учат на PyTorch и Ray, а для ускорения используют 8-битные числа (вариант FP8) и раскладывают экспертов MoE по разным GPU. Это снижает обмен данными между картами и позволяет масштабироваться на очень большие кластеры. Без отдельной "квантизации после обучения".

З.Ы: А в “Собачье сердце” разве не “Потрудитесь излагать ваши мысли яснее.”? По делу готова уточнить любые детали) И еще раз спасибо, что подсветили этот момент 👍🏻

Что значит "это снижает обмен данными"?

Это значит, что между видеокартами передается меньше данных, вместо того чтобы отправлять все данные всем устройствам, система передает только нужные части и делает это в более компактном виде. Поэтому соединение между видеокартами меньше занято, и итерации обучения/запуска идут быстрее и стабильнее

Пока не могу понять, зачем платить Cursor по подписке в формате pay as you go, если можно купить напрямую api ключи и задействовать модели в vs code? Чего такого есть в курсоре, чего нет в оригинале? Индексации нормальной в курсоре нет, token input жрёт столько же, сколько без индексации

Уникальная новая модель? В vscode можно подключить любую модель и пользоваться ей без подписки на copilot

Треды для агентов? В vscode уже есть это

Plan mode? Это всего лишь один из вариантов custom model, который представляет собой md файл с инструкцией для планирования

Насколько понимаю, cursor изначально позволял пользоваться платными моделями в рамках подписки. У него даже где-то есть метрика, сколько бы мы заплатили, если бы мы сами платили за них. Я так понимаю, это замануха на первое время, как с Яндекс.Такси.

Зная политику ценообразования Cursor, то за такую задачу, можно смело почку выкладывать.

Не хватает мобильно клиента, типа VNC но проще и удобнее.

Sign up to leave a comment.

Articles