xonika925 фев в 07:00

Галлюцинации недели: Gemini 3.1 Pro, Sonnet 4.6 в бою и новый дом llama.cpp

3 мин

5.8K

Искусственный интеллектМашинное обучение *

Комментарии 6

Dhwtj 25 фев в 07:14

А то давно мы его не слышали...

Dhwtj 25 фев в 07:39

ИИ породил у сотрудников «комплекс бога»: они поверили, что с его помощью смогут делать любую работу. Маркетологи пишут код, программисты — тексты. Все это такого низкого уровня, что люди выгорают, бесконечно переделывая плохую работу друг за другом

David_Osipov 25 фев в 07:55

Да, с Gemini какая-то фигня происходит на сайте https://gemini.google.com/, он реально на ровном месте галлюцинирует, хотя наполняю контекстное окно на 30-40к где-то (модель 3.1 Pro, у меня платка). А вот на https://aistudio.google.com/ всё пока сносно.

vak0 25 фев в 19:28

А еще на сайте дико экономит выходные токены. Даю задание, требующее объемного вывода данных (5-6 страниц текста), он выводит максимум 1.5-2, сильно снижая этим качество ответа, хоть я на него наезжаю, показываю работу других моделей, мол, смотри, как надо, и т.п. "Да, да - говорит - ща все исправим" и опять только краткий текст. В AI_Studio заметно получше, но все равно максимально лаконично старается отвечать.

StepanBykhovtsov 25 фев в 21:53

Да по-моему такая беда с "лаконичностью" у всех Gemini 3. В AI Studio можно настраивать максимальный размер выхода. Он как бы здоровый, но модель как будто пытается уложиться в 10% от него, и если увеличить этот допустимый выход, модель становится, как мне кажется, поразговорчивее. Но я не специалист, не разбираюсь, так что прошу меня поправить, если не прав.

xonika9 25 фев в 22:13

Я использую Gemini 3 Flash по API для перевода больших лонгридов с англ на русский. Очень хорошо получается. Выдает куски по 30к символов / 3650 слов / 8200 токенов.

В промпте прописал:

Параметр Output Length в AI Studio не заставляет модель писать длинно, он только говорит: “длиннее этого нельзя”. На практике он помогает гарантировать краткость ответа для задач классификации, суммаризации или контроля затрат, latency.

Лучше работать именно с промптом. Для Gemini 3 Google рекомендует температуру 1.0.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий