В русском -- делает, хоть и редко. Уверен, если поискать -- и в английском будут.
А вообще, дожили -- отсутствие грамматических (да и не только) ошибок в тексте считается использованием LLM. Обесцениваете знания тех, кто хорошо учил язык.
а вообще, fallback наоборот может навредить, если нужен ответ от конкретной модели (например, opus-4.7). Кроме того, цена будет другой (если вместо opus-4.7 внезапно будет fallback, настроенный Вами, на условную gpt-5.5)
Вы немного не о том. Вопрос был про параллельный запрос к нескольким моделям и суммаризацию.
Возможно ли сделать супер LLM которая прогоняла бы запрос через несколько моделей, анализировала и выдавала уточненный результат?
Вы ответили про fallback, подразумевая (комментарий же об этом), что его можно использовать в упомянутом качестве -- параллельный запрос с суммаризацией. На что и был мой комментарий.
Fallback -- как я понимаю, это не то же самое, что запрос одновременно к нескольким моделям и суммаризация, а запрос с возможностью гарантированно получить ответ, если какая-то из моделей недоступна. Т.е. отвечает одна модель.
Они считают, что их модели многословные? Уже давно gpt-5.Х выдаёт кучу буллет-поинтов вместо нормального текстового ответа. И в креативном письме их модели почти невозможно использовать -- предложения короткие, почти всегда один абзац-- одно предложение.
Давайте рассмотрим простейший пример запроса к нейросети с нечетко записанными требованиями (пример из проги):
"напиши мне код для рендеринга множества мандельброта".
Что тут модель сможет понять (что самая умная, что самая глупая)? Какой язык программирования использовать? Выберет от балды, скорее всего питон, как наиболее частый. А Вы, например, хотели с++ или js. Но не сказали. Далее, нужно ли сохранение в файл или отображение в gui? Какие цвета/палитра? и тп. Ну модель выберет что-то среднее, наиболее часто встречающееся в обучающем датасете.
При нечетком запросе ответ будет усредненный, а не такой, как Вы хотите.
32 Гб это минимум на котором можно запускать жирные LLM (120b+) с более‑менее приемлемой скоростью
Смысла нет. Тут нужны карту уровня 5090, у которых и цена соответствующая. В статье же идет речь о видеокартах до 150т.р. -- не в той лиге. Причем вряд ли много у кого эти видюхи в количестве больше одной (а там тоже еще надо уметь настраивать). Тут проще подписку брать\платить по токенам, иначе не окупится.
всякие толстые генераторы картинок с вменяемым качеством (которое может и пахнет нейрослопом, но не так сильно). Flux2dev 8bit например, или Wan2.2.
конкретно в моем комментарии я имел в виду модели, которые гарантированно влезут в VRAM видюхи с 16-24гб. Например, квантованный qwen-3.6 27b\35b. Или модели stable diffusion, к которым Flux2dev\Wan2.2 не имеют никакого отношения (хотя даже они с определенной квантизацией, думаю, влезут в 16-24 гб VRAM). Если речь прям про супер-пупер качество: то тут и 120b моделей мало -- нужно брать выше, а это уже локально не запустишь и там модели уже закрытые -- остается только подписка. Аналогично для генерации картинок\видео.
А ещё есть такая штука как файнтюнинг.
Есть 3ds maxы и blenderы, которые на хорошей видеокарте могут рендерить трассировкой пути (не та которая в играх а полноценной) чуть ли не в реалтайме, или в разрешениях 130 МПикс+. Видеокартой
Вот на таких задах и было бы интересно увидеть разницу. Между AMD и NVIDIA, у NVIDIA между 40й и 50й сериями (у которых разница, по сути, только в GDDR6 vs GDDR7, и в DLSS -- а где он используется за пределами игр?). Между 60й,70й,80й, и 90й версиями.
Можно даже запрягать несколько рендерингов одновременно. Можно грузить одновременно генерацию видео и монтажную программу: пока рендерится одно, монтируешь другое.
Тут не очень в курсе, но кажется, Вас опять унесло в область не-потребительских видеокарт. Сомнительно, что Вы сможете эти процессы запустить на 8гб VRAM.
Плюс есть вот такие вот конфигурации мониторов в которых современные недооптимизированные игры на человеческой видеокарте выдадут, в лучшем случае, 10 фпс. Если вообще запустятся.
О том и речь: игры мало показывают уровень видеокарты. Да и к чему опять про игры? Такие конфигурации мониторов наверняка нужны не только для игр.
И вообще: что значит "человеческая видеокарта"? Есть "нечеловеческая"? Инопланетная?
В общем, смысл в том, что граница между профессиональным использованием и игровым нечёткая, она размыта — это раз
Частично соглашусь. Но описанные профессиональные случаи тянут на конфигурацию нескольких видеокарт (либо одну\несколько профессиональных), у которых ценовой сегмент совершенно другой.
два — есть особо тяжелые игровые сетапы с большой площадью экранов и/или высокими требованиями к fps, которые обычные видеокарты просто не потянут.
Мой коммент был про не-игровые варианты использования видеокарт потребительского сегмента, разбираемого в статье (т.е. до 100-150 т.р.). Вы же почему-то все время говорите про сегмент явно более высокой ценовой категории и опять про игры.
Вы считаете, что умение формулировать свою мысль при разговоре с людьми неважно? Похоже, именно поэтому сложно понять кучу людей, которые не могут четко донести мысль в письменной или устной формле
Гугл транслейт в последнее время (последний год точно) оч фигово работает. Часто не может прогрузиться, перевод выглядит как дословный, иногда даже с ошибками в грамматике, одна вкладка весит под сотню мб... куда уж тут ии-тренажер ещё
Проще писать по-русски: "выпустили") Что "релизнули", что "дропнули" -- просто транслит с английского. Drop в английском в этом контексте "сбросить", мб "уронить". Наиболее близкий аналог на русском, пожалуй, "бросили (кость собакам)".
Вспоминается картинка-мем "секундочку, ща лайк поставлю". Так вот, на ней тоже drop))
Но вот чем плох русский вариант "выпустили", что его редко используют -- ума не приложу)
Слушайте, ну давайте не врать в заголовках! Если ЧД взорвётся даже сегодня, мы сможем увидеть это событие не раньше, чем через тысячи/сотни тысяч лет, в зависимости от расстояния (и это будем уже не мы, а те, кто останутся после нас, если вообще останутся). Совершенно разные значения у "Взрыв чёрной дыры ожидается в ближайшие 10 лет" и "Мы можем стать свидетелями взрыва ЧД в ближайшие 10 лет" в контексте астрономических расстояний.
Теперь компания вносит изменения в работу приостановки обновлений, позволяя пользователям Windows выбирать определённую дату для приостановки обновлений на срок до 35 дней с помощью всплывающего календаря. Затем эту паузу можно многократно продлевать без фиксированного ограничения.
Т.е. серьёзно можно продлевать приостановку за 35й день?
предлагая варианты «Перезагрузка» и «Выключение» без запуска обновлений, в то время как обычные варианты «Обновить и перезагрузить» и «Обновить и выключить» используются, когда апдейты готовы к установке.
Чёт неясно: чем это отличается от того, что было на 10ке?
на компьютерах с Windows 10, которые не участвуют в программе расширенных обновлений безопасности (ESU), больше нет возможности приостанавливать обновления.
Интересно, а что они собираются обновлять, если официально перестали поддерживать 10ку?
В русском -- делает, хоть и редко. Уверен, если поискать -- и в английском будут.
А вообще, дожили -- отсутствие грамматических (да и не только) ошибок в тексте считается использованием LLM. Обесцениваете знания тех, кто хорошо учил язык.
а вообще, fallback наоборот может навредить, если нужен ответ от конкретной модели (например, opus-4.7). Кроме того, цена будет другой (если вместо opus-4.7 внезапно будет fallback, настроенный Вами, на условную gpt-5.5)
Вы немного не о том. Вопрос был про параллельный запрос к нескольким моделям и суммаризацию.
Вы ответили про fallback, подразумевая (комментарий же об этом), что его можно использовать в упомянутом качестве -- параллельный запрос с суммаризацией. На что и был мой комментарий.
на опенроутере через fallback нельзя отправлять запросы к нескольким моделям параллельно
Fallback -- как я понимаю, это не то же самое, что запрос одновременно к нескольким моделям и суммаризация, а запрос с возможностью гарантированно получить ответ, если какая-то из моделей недоступна. Т.е. отвечает одна модель.
Это обычный агент. В openai agents sdk есть agents as tools. В качестве инструментов как раз могут быть запросы через другие модели
Что за зверь такой?
Они считают, что их модели многословные? Уже давно gpt-5.Х выдаёт кучу буллет-поинтов вместо нормального текстового ответа. И в креативном письме их модели почти невозможно использовать -- предложения короткие, почти всегда один абзац-- одно предложение.
error 404. Случайно выложили и решили удалить?
ДвижОк
Давайте рассмотрим простейший пример запроса к нейросети с нечетко записанными требованиями (пример из проги):
"напиши мне код для рендеринга множества мандельброта".
Что тут модель сможет понять (что самая умная, что самая глупая)? Какой язык программирования использовать? Выберет от балды, скорее всего питон, как наиболее частый. А Вы, например, хотели с++ или js. Но не сказали. Далее, нужно ли сохранение в файл или отображение в gui? Какие цвета/палитра? и тп. Ну модель выберет что-то среднее, наиболее часто встречающееся в обучающем датасете.
При нечетком запросе ответ будет усредненный, а не такой, как Вы хотите.
А что, компиляторы уже поддерживают все фичи c++20, в т.ч. модули?
Не поспоришь.
Смысла нет. Тут нужны карту уровня 5090, у которых и цена соответствующая. В статье же идет речь о видеокартах до 150т.р. -- не в той лиге. Причем вряд ли много у кого эти видюхи в количестве больше одной (а там тоже еще надо уметь настраивать). Тут проще подписку брать\платить по токенам, иначе не окупится.
конкретно в моем комментарии я имел в виду модели, которые гарантированно влезут в VRAM видюхи с 16-24гб. Например, квантованный qwen-3.6 27b\35b. Или модели stable diffusion, к которым Flux2dev\Wan2.2 не имеют никакого отношения (хотя даже они с определенной квантизацией, думаю, влезут в 16-24 гб VRAM). Если речь прям про супер-пупер качество: то тут и 120b моделей мало -- нужно брать выше, а это уже локально не запустишь и там модели уже закрытые -- остается только подписка. Аналогично для генерации картинок\видео.
Вот на таких задах и было бы интересно увидеть разницу. Между AMD и NVIDIA, у NVIDIA между 40й и 50й сериями (у которых разница, по сути, только в GDDR6 vs GDDR7, и в DLSS -- а где он используется за пределами игр?). Между 60й,70й,80й, и 90й версиями.
Тут не очень в курсе, но кажется, Вас опять унесло в область не-потребительских видеокарт. Сомнительно, что Вы сможете эти процессы запустить на 8гб VRAM.
О том и речь: игры мало показывают уровень видеокарты. Да и к чему опять про игры? Такие конфигурации мониторов наверняка нужны не только для игр.
И вообще: что значит "человеческая видеокарта"? Есть "нечеловеческая"? Инопланетная?
Частично соглашусь. Но описанные профессиональные случаи тянут на конфигурацию нескольких видеокарт (либо одну\несколько профессиональных), у которых ценовой сегмент совершенно другой.
Мой коммент был про не-игровые варианты использования видеокарт потребительского сегмента, разбираемого в статье (т.е. до 100-150 т.р.). Вы же почему-то все время говорите про сегмент явно более высокой ценовой категории и опять про игры.
Вы считаете, что умение формулировать свою мысль при разговоре с людьми неважно? Похоже, именно поэтому сложно понять кучу людей, которые не могут четко донести мысль в письменной или устной формле
Гугл транслейт в последнее время (последний год точно) оч фигово работает. Часто не может прогрузиться, перевод выглядит как дословный, иногда даже с ошибками в грамматике, одна вкладка весит под сотню мб... куда уж тут ии-тренажер ещё
Проще писать по-русски: "выпустили") Что "релизнули", что "дропнули" -- просто транслит с английского. Drop в английском в этом контексте "сбросить", мб "уронить". Наиболее близкий аналог на русском, пожалуй, "бросили (кость собакам)".
Вспоминается картинка-мем "секундочку, ща лайк поставлю". Так вот, на ней тоже drop))
Но вот чем плох русский вариант "выпустили", что его редко используют -- ума не приложу)
Слушайте, ну давайте не врать в заголовках! Если ЧД взорвётся даже сегодня, мы сможем увидеть это событие не раньше, чем через тысячи/сотни тысяч лет, в зависимости от расстояния (и это будем уже не мы, а те, кто останутся после нас, если вообще останутся). Совершенно разные значения у "Взрыв чёрной дыры ожидается в ближайшие 10 лет" и "Мы можем стать свидетелями взрыва ЧД в ближайшие 10 лет" в контексте астрономических расстояний.
Т.е. серьёзно можно продлевать приостановку за 35й день?
Чёт неясно: чем это отличается от того, что было на 10ке?
Интересно, а что они собираются обновлять, если официально перестали поддерживать 10ку?
Вы упомянули четко только версию gpt: 5.5. А какой клод? Какой грок? Какой квен?