Обновить
1
Александр@Altair2021

Пользователь

0,1
Рейтинг
Отправить сообщение

типа сравнения двух таблиц с выводом номеров строк при обнаружении совпадений (по факту немного усложненное ВПР), ни одна не справилась нормально

использование LLM в данной задаче, в принципе, аналогично использованию их в качестве калькулятора -- то же самое забивание гвоздей микроскопом. Они под это в принципе не заточены. Если нужен какой-то детерминированный ответ/ответ на основе четкого алгоритма, то LLM не шибко подходят.

Пробовал консультироваться по импортной документации - пишут ерунду сразу, не понимают контекста сколько бы я не улучшал промт.

Тут довольно тонкая грань: если документация большая, она банально может не влезть в контекст LLM. А если влезет -- хорошо известна проблема падения понимания LLM с увеличением контекста.

gpt 5.2 уровни ризонинга:

  • Low

  • Medium

  • High

  • Extra high

++ Extreme high))

И в чем, интересно, разница между high/extra high/extreme high?)) И что потом? Ulta high? Extreme ultra high? Impossible high?

Почему это работает?

Для такого короткого текста нужна llm'ка?

В последнее время триггерит с этих "why it works", когда вообще не "works"

Тоже Германия, не работает. Как я понимаю, гугл может опираться на то, где и когда был зарегистрирован акк. В том числе учитывает номер телефона.

Не показательно, только если не отключить у модели ризонинг. Иначе она может наризонить/нагаллюционировать на сотни-тысячи токенов. Кроме того, у разных моделей разные токенизаторы, и один и тот же текст может занимать разное количество токенов. Например, у клода токены мельче, чем у дипсика.

А можно примеры таких агрегаторов? Сам пользуюсь ботхабом около года по апи -- на момент выбора их условия были самыми выгодными. Доп рубль через апи не снимается (через апи чисто доступ к моделям, а в веб версии еще куча прибамбасов).

А по какому курсу конвертировали цену опенроутера в рубли?) Там, насколько я помню, все в долларах

А можно выбрать сервис типа openrouter.ai, и не зависеть от впс (по крайней мере пока), не быть привязанным только к моделям опенаи.

Касаемо json: есть такая штука как structured_output.

Касаемо таймаута: можно использовать потоковую генерацию (stream=True) -- тогда не нужно ждать, пока модель вернёт ответ целиком, можно сохранить даже частичный ответ в случае обрыва соединения.

Как насчёт привести количество входных и выходных токенов на каждый из вариантов? Мб в варианте с опенроутера модель сгенерировала 100 токенов, а в варианте с ботхаба -- 1000? (Условные цифры)

Не подскажете, как сделать так, чтобы гугл через впн не говорил, что сервис "недоступен в вашей стране"?

Большинство бесплатных моделей с опенроутера недоступны( А те, которые тестируют, предоставляя бесплатный доступ, обычно быстро закрывают

Дык в статье речь идёт не про генерацию картинок часов, а про генерацию html-кода, отображающего часы. Разные вещи. Вы пробовали создать html-скрепки?)

Дык в статье речь идёт не про генерацию картинок часов, а про генерацию html-кода, отображающего часы. Разные вещи. Вы пробовали создать html-термометр?)

Дык речь идёт не про генерацию картинок часов, а про генерацию html-кода, отображающего часы. Разные вещи

LibreOffice раскритиковала «поддельный открытый исходный код» OnlyOffice за сотрудничество с Microsoft

По смыслу выходит, что раскритикован исходный код за сотрудничество с Microsoft. Реально код сотрудничает? Или таки OnlyOffice?

А где галлюцинации-то?)

Интересная сейчас мода: почти про любую llm писать, что она "бросает вызов дипсику". Причём как старому типа 3.2, так и потенциальному v4. Кликбейт на кликбейте и кликбейтом погоняет.

Я из тех, кто предпочитает боковую панель) И вертикальные вкладки в браузере). Когда открыто много приложений/окон, куда удобнее прокручивать их, если они не вмещаются в область видимости -- мне куда удобнее переключать приложения кликом мышки, а не запоминанием комбинаций клавиш клавиатуры, которые, причём, работают медленнее (лишние действия). А для переключения мышкой лучше, чтобы все были в области видимости. На винде 10 панель задач при переполнении просто добавляет вторую строку (или столбец в вертикальной панели на 8 винде), до которой просто прокруткой добраться нельзя, нужно кликать (лишние действия).

На убунте реализация, можно сказать, идеальная. А на винде постоянные свистопляски с "добавят-уберут". И насыплют вдобавок кучу багов. Если на винде 11 добавят возможность вертикальной панели, можно будет наконец обновиться с 10ки)

Вопрос не ко мне, а к автору исходного комментария)

Если говорить о человеке, то речь про вдохновение)

Полагаю, Вы пытались сгенерировать песню именно на русском языке? Если так, спешу огорчить: проблемы с русским наблюдаются даже у крупных llm (от дипсика до опенаи), не говоря уже про нишевые модели (т.е. используемые под капотом suno/riffusion). По‐моему, только модели антропика сейчас без огрехов в русском.

Проблема, как я понимаю, в дисбалансе тренировочных данных -- гигантский перекос в сторону английского. Теперь касаемо моделей генерации текста в suno/riffusion: про них известно почти ничего. Велика вероятность, что они куда меньше крупных llm, и куда вероятнее, что они были затьюнены под генерацию песен на английском (например, udio. Suno, наверняка, имеет более обширный датасет). Т.е. если тестировать на стихотворные произведения, то на английском.

Попробуйте claude (и лучше на английском) -- возможно, результат удивит в приятном смысле.

Информация

В рейтинге
4 555-й
Откуда
Россия
Зарегистрирован
Активность