Поскольку мир становится все более цифровым, люди постоянно ищут новые способы общения друг с другом. Одним из самых популярных приложений для обмена сообщениями сегодня является Telegram, который позволяет пользователям отправлять друг другу сообщения, фотографии и видео. Но что, если бы вы могли делать больше, чем просто отправлять сообщения? Что, если бы вы могли поговорить с ботом, который использует искусственный интеллект, чтобы понимать ваши сообщения и отвечать на них?
Это именно то, что я намеревался сделать, когда создавал телеграмм-бота ChatGPT. Этот бот использует OpenAI GPT-3.5, чтобы предоставить пользователям более естественный и похожий на человеческий опыт общения. Но я не остановился на достигнутом. Я также включил контекст, рисование ИИ и парсинг Google, чтобы сделать бота еще более мощным и универсальным.
Для начала мне нужно было получить необходимые API и установить переменные среды. Первым API, который мне понадобился, был ключ OpenAI, который я получил на веб-сайте OpenAI. С помощью этого ключа я смог получить доступ к модели GPT-3.5-turbo, которая представляет собой мощную языковую модель, которая может понимать ввод на естественном языке и реагировать на него.
Дале�� мне понадобился ключ от Stable Diffusion, который предоставляет услуги рисования AI. Этот ключ позволил мне включить рисование в бота, что означает, что пользователи могут отправлять команду Paint с описанием сцены.
Затем мне понадобился ключ от модели replicate.com, который обеспечивает преобразование изображения в текст. С помощью этого ключа я смог включить функциональность OCR.
После того, как у меня были настроены все необходимые API и переменные среды, я начал создавать бота. Первым шагом было создание бота Telegram с использованием Telegram Bot API. Этот API предоставляет простой способ создания и управления ботами на платформе Telegram.
const replicate = new Replicate({ token: process.env.REPLICATE_KEY }); const openai = new OpenAIApi(new Configuration({ apiKey: process.env.OPENAI_KEY })); const bot = new TelegramBot(process.env.TELEGRAM_KEY, { polling: true }); const translation = new TranslationServiceClient();
Далее мне нужно было интегрировать OpenAI API в бота. При этом задействован node-telegram-api, который получает сообщения от пользователей и отправляет их в API OpenAI для обработки. Как только API вернул ответ, мне пришлось отформатировать его и отправить обратно пользователю через бота Telegram.
const getText = async (prompt, temperature, max_tokens, chatId) => { try { const completion = await openai.createChatCompletion({ model: "gpt-3.5-turbo", messages: [{ role: "user", content: prompt }], max_tokens: max_tokens, temperature: temperature, }); const response = completion?.data?.choices?.[0]?.message?.content; return response; } catch (e) { console.error(e.message); } };
Чтобы сделать бота еще более мощным, я решил включить контекст в разговор. Это означает, что бот запоминает предыдущие сообщения и использует их для предоставления более персонализированных ответов. Например, если пользователь просит бота порекомендовать ресторан, бот запомнит местоположение пользователя и предыдущие предпочтения ресторана, чтобы предоставить более релевантную рекомендацию.
// Brain activity context[chatId] = context[chatId]?.slice(-CONTEXT_SIZE * premium(chatId)) ?? ""; writeContext(context); if (msg.photo) { // visual hemisphere (left) visualToText(chatId, msg); } msg.text = msg.text?.substring(0, MAX_LENGTH * premium(chatId)); if (msgL.startsWith("google")) { textToGoogle(chatId, msg.text.slice(7), msg.from?.language_code); } else { if (msgL.startsWith("draw") || msgL.startsWith("paint")) { // visual hemisphere (left) textToVisual(chatId, msgL, msg.from?.language_code); } else { // audio hemisphere (right) textToText(chatId, msg); } }
С интегрированными API-интерфейсами Stable Diffusion и Google парсинга бот стал еще более универсальным. Теперь пользователи могут попросить бота искать информацию в Интернете и получать соответствующие результаты.
const textToVisual = async (chatId, text, language_code) => { if (text === "draw" || text === "paint") { // link between right and left hemisphere (painting) text = last[chatId]; } if ((language_code == "ru" && !text?.startsWith("draw"))) { text = await translate(text, "en"); } const photo = await getArt( text + (text?.startsWith("draw") ? "" : ", deep focus, highly detailed, digital painting, artstation, 4K, smooth, sharp focus, illustration") ); if (photo) { bot.sendPhoto(chatId, photo); } };
Создание телеграмм-бота ChatGPT было сложным, но полезным опытом. Интегрировав несколько API и используя контекст, стабильное рисование ИИ и парсинг Google, я смог создать бота, который обеспечивает пользователям более естественный и человеческий опыт общения. Поскольку технология искусственного интеллекта продолжает развиваться, я с нетерпением жду, какие новые возможности она принесет в такие приложения для обмена сообщениями, как Telegram.
