Pull to refresh

Comments 9

Активно использую Gemini 2 Flash в нескольких своих проектах. (Генератор визуальных новелл и Виртуальная примерочная). Нейронка действительно не плохая, бесплатная, понимает русский язык.

Есть и минусы, сильно зацензурена, т.е. для новелл 18+ не подходит, в Виртуальной примерочной порой на купальники негативно реагирует.

Настройка фильтров контента, которые используются для текстовой модели, к сожалению gemini-2.0-flash-exp-image-generation игнорирует. Так же в отличие от Imagen 3, невозможно указать соотношение сторон, да и размер итогового изображения тоже никак не задать. Кстати, иногда болеет стандартными болячками, в виде размытого лица.

А смогу ли я прикрутить Gemini 2 Flash для своей игрушки на Unity и C#, в которой чувачок-детектив ходит по деревне и общается с разными nps и ищет убийцу. Мне хотелось бы сделать чтобы NPC использовали AI для генерации ответов. Раньше меня смущало, что API платное, но как я понял теперь есть бесплатные 1млн токенов в час? Или я рано губу раскатал?

можно, всё в ваших руках

Гугл предоставляет и OpenAI совместимый интерфейс, можно код писать используя OpenAI клиент и потом уже направлять куда угодно, включая локальные модели

Разве бел платная версия api поддерживает сохранения контекста? Такое у gpt есть только..

Нет но это просто немного усложняет работу с контекстом. Каждый раз его приходится отправлять заново. Скорее всего на такую фичу просто нет реального запроса, технически реализовать это несложно и поддерживать недорого.

Да, но проблема такого подхода заключается у том что мы каждый раз передаём в промпт всю историю. И каждый раз она все больше и больше и однажды промпт будет столь велик что мы не сможем отправить запрос вовсе. А в случае с api gpt где вся история чата храниться на сервере gpt мы не паримся за историю. А просто передаём некий chtId условно.

Очень странная ситуация. Я попробовал получить изменённое изображение, реализация на c#. По итогу в ответ приходит текст что, изменения произведены над передаваемой картинкой , но изображения нету. А если указываю

generationConfig: { responseModalities: ['Text', 'Image'] }

то получаю ошибку что модель не поддерживает возврат картинок, а может только принимать и анализировать. Хотя документация gemini говорит об обратном..

import { GoogleGenAI, Modality } from '@google/genai';

const contents = [
  { text: prompt },
  {
	inlineData: {
	  mimeType: 'image/jpeg',
	  data: imageBase64,
	},
  },
];


response = await ai.models.generateContent({
	model: 'gemini-2.0-flash-exp',
	contents,
	config: {
	  responseModalities: [Modality.IMAGE, Modality.TEXT],
	},
});

На прошлой неделе с этим же столкнулся, потыкался немного, плюнул, перешел на gemini-api от гугла и заработало.

Sign up to leave a comment.

Articles