Да, можно попробовать разместить вторую, вспомогательную ИИ-модель на второй видеокарте. Llama.cpp, exllama умеют распределять слои между GPU, и тогда 6 ГБ карты GTX 1060 расширят суммарный объём видеопамяти. Но скорость передачи и генерации будет упираться в более медленную карту – имеет смысл только тогда, когда необходимо запустить объёмную модель, которая не влезает в память основной видеокарты. Ведь если бы 5060 Ti сама имела 24–32 ГБ памяти, то скорость генерации, судя по подсчётам, была бы в 2–2,5 раза выше, чем связка RTX 5060 Ti 16 GB + GTX 1060 6GB.
Также на GTX 1060 можно параллельно: запускать PhysX (переносить обработку физики на отдельную видеокарту, некоторые игры такое поддерживали – Mirror's Edge, Borderlands 2 и т. п.); стримить или кодировать видео, пока на основной видеокарте делается что-то другое; подключать ещё больше мониторов, имея дополнительные разъёмы.
Минусы: дополнительные 100–120 Вт на блок питания под нагрузкой; дополнительный нагрев в корпусе; возможно, 5060 Ti уйдёт с режима x16 на x8 (хотя это некритично). В итоге в случае игр смысла практически не имеется, но для нейронок есть.
Свежие данные Ramp AI Index, основанные на анализе корпоративных карт и счетов более 50 000 американских компаний, показывают любопытную закономерность: чем глубже отрасль внедряет ИИ, тем сильнее её симпатии смещаются в сторону Anthropic, а не OpenAI.
Вот как подсчитывали данную статистику в Ramp AI:
По каждой отрасли у них имеются данные, сколько процентов компаний внутри этой отрасли вообще применяют ИИ-технологии (то есть у скольки процентов компаний внутри этой отрасли имеются финансовые платежи нейропровайдерам – это закрытые транзакционыне данные, доступные Ramp). Например: в отрасли A 70% компаний применяют ИИ = отрасль активно применяет ИИ; в отрасли Б 15% компаний применяют ИИ = отрасль менее активно применяет ИИ.
Путём анализа финансовых платежей определяли, имеются ли платежи провайдерам OpenAI и Anthropic (или и тому и другому). Важный момент: для простоты здесь не считали пропорции платежей («Компания пользуется и ChatGPT, и Claude, однако Claude применяет более активно, в соотношении 60%:40%») – хотя, на мой взгляд, это выглядело бы более логично; а просто брали бинарное состояние – имеются платежи провайдеру OpenAI (да/нет), имеются платежи Anthropic (да/нет).
Всё это перемножали/делили/суммировали и таким образом пришли к выводу, что: чем активнее отрасль применяет ИИ (определяя это методом в п. 1), тем чаще там будет присутствовать Claude, либо оба – ChatGPT и Claude (определяя по п. 2).
Ага, вижу: единственный выход – поднять промежуточный веб-сервер, тогда будет идти через локальное приложение Cursor → сервер Cursor → наш промежуточный веб-сервер → localhost-модель. Цепочка не очень удобная. Что ж, зато можно привинтить Roo Code или Cline!
Результат этой ночной работы – репозиторий claw-code. Он соответствует стандарту clean-room design: здесь нет ни одной строки оригинального TypeScript-кода, но полностью воспроизведена архитектура ИИ-агентного фреймворка Claude Code. А значит, предыдущая DMCA-жалоба Anthropic перед этим новым кодом бессильна.
Что было объявлено на GTC 2026 (16–19 марта 2026-го).
Главным героем стал Vera Rubin, а не Feynman.
Кремниевая фотоника и архитектура Feynman, которые автор статьи считал главной интригой, на сцене почти не прозвучали. Центром конференции стала платформа Vera Rubin, уже находящаяся в производстве. Она объединяет семь типов чипов в пять rack-scale-компьютеров, работающих как единый ИИ-суперкомпьютер, и выдаёт 3,6 экзафлопса вычислений и 260 терабайт в секунду пропускной способности NVLink.
Независимый анализ SemiAnalysis подтвердил, что система обеспечивает около 50x больше токенов на ватт по сравнению с Hopper H200. Аналитик Дилан Пател обвинил Хуанга в том, что тот “занижает цифры”, – и оказался прав. (Atlan)
Groq 3 LPU – неожиданный сюрприз.
Хуанг представил Nvidia Groq 3 LPU – первый чип от стартапа Groq, который Nvidia поглотила в декабре за 20 миллиардов долларов. Чип ожидается к отгрузке в третьем квартале. Специальная стойка Groq 3 LPX вмещает 256 таких ускорителей и предназначена для работы рядом с rack-системой Vera Rubin. (CNBC)
Vera Rubin и Groq 3 LPU тесно связаны через программный слой NVIDIA Dynamo, который разделяет задачи инференса между двумя архитектурами.
Kyber – следующее поколение после Rubin.
Хуанг показал прототип Kyber – новой rack-архитектуры с 144 GPU, расположенными вертикально для повышения плотности и снижения задержек. Kyber войдёт в состав Vera Rubin Ultra и ожидается в 2027 году.
Триллион долларов заказов.
Хуанг объявил, что ожидает заказы на чипы Blackwell и Vera Rubin в совокупности на 1 триллион долларов к 2027 году – вдвое больше прежней оценки в 500 миллиардов.
Итог. Автор оригинальной статьи угадал примерно половину. Слово “потрясёт мир” оказалось про масштаб бизнеса (триллион долларов) и комплексность платформы, а не про прорыв кремниевой фотоники. Feynman так и остался “чипом 2027 года” – его лишь мельком упомянули. Главный месседж GTC 2026 состоял в другом: Nvidia хочет стать операционным слоем для экономики агентного ИИ – от обучения и инференса до хранения, безопасности и физического развёртывания. (eWEEK)
Обработка физических данных происходит локально внутри робота: https://resources.today/PDF/42ECOR123.pdf. Но к мобильной сети тоже подключён (например, оператор подключается в нештатных ситуациях). Да, думаю, что в белых списках.
Спасибо, отличный звук!
Да, можно попробовать разместить вторую, вспомогательную ИИ-модель на второй видеокарте. Llama.cpp, exllama умеют распределять слои между GPU, и тогда 6 ГБ карты GTX 1060 расширят суммарный объём видеопамяти. Но скорость передачи и генерации будет упираться в более медленную карту – имеет смысл только тогда, когда необходимо запустить объёмную модель, которая не влезает в память основной видеокарты. Ведь если бы 5060 Ti сама имела 24–32 ГБ памяти, то скорость генерации, судя по подсчётам, была бы в 2–2,5 раза выше, чем связка RTX 5060 Ti 16 GB + GTX 1060 6GB.
Также на GTX 1060 можно параллельно: запускать PhysX (переносить обработку физики на отдельную видеокарту, некоторые игры такое поддерживали – Mirror's Edge, Borderlands 2 и т. п.); стримить или кодировать видео, пока на основной видеокарте делается что-то другое; подключать ещё больше мониторов, имея дополнительные разъёмы.
Минусы: дополнительные 100–120 Вт на блок питания под нагрузкой; дополнительный нагрев в корпусе; возможно, 5060 Ti уйдёт с режима x16 на x8 (хотя это некритично). В итоге в случае игр смысла практически не имеется, но для нейронок есть.
Ага, и ещё видео. Спасибо, поправил!
Дело в том, что в этих X-постах зарыты видео. Перезаливать их очень долго, пока что добавляем так. Но обычные, да, лучше добавлять скриншотами.
Спасибо, исправил на “управляет свыше чем 600 петабайтами данных”.
Вот как подсчитывали данную статистику в Ramp AI:
По каждой отрасли у них имеются данные, сколько процентов компаний внутри этой отрасли вообще применяют ИИ-технологии (то есть у скольки процентов компаний внутри этой отрасли имеются финансовые платежи нейропровайдерам – это закрытые транзакционыне данные, доступные Ramp). Например: в отрасли A 70% компаний применяют ИИ = отрасль активно применяет ИИ; в отрасли Б 15% компаний применяют ИИ = отрасль менее активно применяет ИИ.
Путём анализа финансовых платежей определяли, имеются ли платежи провайдерам OpenAI и Anthropic (или и тому и другому). Важный момент: для простоты здесь не считали пропорции платежей («Компания пользуется и ChatGPT, и Claude, однако Claude применяет более активно, в соотношении 60%:40%») – хотя, на мой взгляд, это выглядело бы более логично; а просто брали бинарное состояние – имеются платежи провайдеру OpenAI (да/нет), имеются платежи Anthropic (да/нет).
Всё это перемножали/делили/суммировали и таким образом пришли к выводу, что: чем активнее отрасль применяет ИИ (определяя это методом в п. 1), тем чаще там будет присутствовать Claude, либо оба – ChatGPT и Claude (определяя по п. 2).
Ага, вижу: единственный выход – поднять промежуточный веб-сервер, тогда будет идти через локальное приложение Cursor → сервер Cursor → наш промежуточный веб-сервер → localhost-модель. Цепочка не очень удобная. Что ж, зато можно привинтить Roo Code или Cline!
Имеется в виду запуск не напрямую в Cursor, а через localhost.
Тоже вот интересно, что там за версия (3 или 4)?
Да, это я видел. Но точная версия этого режима неизвестна (может быть 3-я или 4-я). Новость же именно про модели 4-й версии.
Спасибо, добавил языки.
В следующей версии обещали убрать из датасетов все галлюцинации. Потому что уже не смешно.
Ответил в личку.
Спасибо, подумаем!
Некогда объяснять, просто запустите промпты.
Да, совсем недавно было такое: https://www.searchenginejournal.com/research-you-are-an-expert-prompts-can-damage-factual-accuracy/570397/.
Вот что произошло на самом деле.
Что было объявлено на GTC 2026 (16–19 марта 2026-го).
Главным героем стал Vera Rubin, а не Feynman.
Кремниевая фотоника и архитектура Feynman, которые автор статьи считал главной интригой, на сцене почти не прозвучали. Центром конференции стала платформа Vera Rubin, уже находящаяся в производстве. Она объединяет семь типов чипов в пять rack-scale-компьютеров, работающих как единый ИИ-суперкомпьютер, и выдаёт 3,6 экзафлопса вычислений и 260 терабайт в секунду пропускной способности NVLink.
Независимый анализ SemiAnalysis подтвердил, что система обеспечивает около 50x больше токенов на ватт по сравнению с Hopper H200. Аналитик Дилан Пател обвинил Хуанга в том, что тот “занижает цифры”, – и оказался прав. (Atlan)
Groq 3 LPU – неожиданный сюрприз.
Хуанг представил Nvidia Groq 3 LPU – первый чип от стартапа Groq, который Nvidia поглотила в декабре за 20 миллиардов долларов. Чип ожидается к отгрузке в третьем квартале. Специальная стойка Groq 3 LPX вмещает 256 таких ускорителей и предназначена для работы рядом с rack-системой Vera Rubin. (CNBC)
Vera Rubin и Groq 3 LPU тесно связаны через программный слой NVIDIA Dynamo, который разделяет задачи инференса между двумя архитектурами.
Kyber – следующее поколение после Rubin.
Хуанг показал прототип Kyber – новой rack-архитектуры с 144 GPU, расположенными вертикально для повышения плотности и снижения задержек. Kyber войдёт в состав Vera Rubin Ultra и ожидается в 2027 году.
Триллион долларов заказов.
Хуанг объявил, что ожидает заказы на чипы Blackwell и Vera Rubin в совокупности на 1 триллион долларов к 2027 году – вдвое больше прежней оценки в 500 миллиардов.
Итог. Автор оригинальной статьи угадал примерно половину. Слово “потрясёт мир” оказалось про масштаб бизнеса (триллион долларов) и комплексность платформы, а не про прорыв кремниевой фотоники. Feynman так и остался “чипом 2027 года” – его лишь мельком упомянули. Главный месседж GTC 2026 состоял в другом: Nvidia хочет стать операционным слоем для экономики агентного ИИ – от обучения и инференса до хранения, безопасности и физического развёртывания. (eWEEK)
Судя по всему, очень невременная.
Обработка физических данных происходит локально внутри робота: https://resources.today/PDF/42ECOR123.pdf. Но к мобильной сети тоже подключён (например, оператор подключается в нештатных ситуациях). Да, думаю, что в белых списках.