Comments 9
Активно использую Gemini 2 Flash в нескольких своих проектах. (Генератор визуальных новелл и Виртуальная примерочная). Нейронка действительно не плохая, бесплатная, понимает русский язык.
Есть и минусы, сильно зацензурена, т.е. для новелл 18+ не подходит, в Виртуальной примерочной порой на купальники негативно реагирует.
Настройка фильтров контента, которые используются для текстовой модели, к сожалению gemini-2.0-flash-exp-image-generation игнорирует. Так же в отличие от Imagen 3, невозможно указать соотношение сторон, да и размер итогового изображения тоже никак не задать. Кстати, иногда болеет стандартными болячками, в виде размытого лица.
А смогу ли я прикрутить Gemini 2 Flash для своей игрушки на Unity и C#, в которой чувачок-детектив ходит по деревне и общается с разными nps и ищет убийцу. Мне хотелось бы сделать чтобы NPC использовали AI для генерации ответов. Раньше меня смущало, что API платное, но как я понял теперь есть бесплатные 1млн токенов в час? Или я рано губу раскатал?
Гугл предоставляет и OpenAI совместимый интерфейс, можно код писать используя OpenAI клиент и потом уже направлять куда угодно, включая локальные модели
Разве бел платная версия api поддерживает сохранения контекста? Такое у gpt есть только..
Нет но это просто немного усложняет работу с контекстом. Каждый раз его приходится отправлять заново. Скорее всего на такую фичу просто нет реального запроса, технически реализовать это несложно и поддерживать недорого.
Да, но проблема такого подхода заключается у том что мы каждый раз передаём в промпт всю историю. И каждый раз она все больше и больше и однажды промпт будет столь велик что мы не сможем отправить запрос вовсе. А в случае с api gpt где вся история чата храниться на сервере gpt мы не паримся за историю. А просто передаём некий chtId условно.
Очень странная ситуация. Я попробовал получить изменённое изображение, реализация на c#. По итогу в ответ приходит текст что, изменения произведены над передаваемой картинкой , но изображения нету. А если указываю
generationConfig: { responseModalities: ['Text', 'Image'] }
то получаю ошибку что модель не поддерживает возврат картинок, а может только принимать и анализировать. Хотя документация gemini говорит об обратном..
import { GoogleGenAI, Modality } from '@google/genai';
const contents = [
{ text: prompt },
{
inlineData: {
mimeType: 'image/jpeg',
data: imageBase64,
},
},
];
response = await ai.models.generateContent({
model: 'gemini-2.0-flash-exp',
contents,
config: {
responseModalities: [Modality.IMAGE, Modality.TEXT],
},
});
На прошлой неделе с этим же столкнулся, потыкался немного, плюнул, перешел на gemini-api от гугла и заработало.
Как интегрировать Gemini 2.0 Flash в ваше веб-приложение