All streams
Search
Write a publication
Pull to refresh
1
1
Роман Жданов @Pemuul

GPTолог

Send message

Специально взял модель постарше!

И получил даже от неё очень хороший ответ, даже без обдумывания.

Так как она обучена на каласальном объёме данных, то в ней уже есть примеры как кодированный текст превращается в обычный и наоборот, и просто на основе этого она может кодировать и декодировать текст на лету, даже не обдумывая.

Но на этом решил не остановить, и зашифровал через ключ.
Версия 4o не справилась.
5 версия без обдумывания дала ответ сразу.

Думаю, что если взять и создать нейронку чисто под задачи шифрования, она порвёт всё и вся. Возможно такое даже уже есть.

Вы правы!

Спасибо за пример!

Thinking — это не сама нейросеть, а алгоритм, который решает поставленную задачу через неё.

Текст, который мы отправляем в нейросеть, прогоняется через неё несколько раз с разными параметрами. Как именно — зависит от алгоритма на стороне платформы, но в целом это выглядит так:

  1. Ставится задача: разбить введённый текст на пул подзадач — что нужно сделать и что в итоге получить.

  2. Каждый элемент пула обрабатывается отдельно, и мы получаем результаты.

  3. Все полученные результаты собираются и ещё раз отправляются в нейросеть, чтобы на основе всей совокупности информации получить ответ.

Так и происходит «обдумывание».
Кроме того, нейросеть не всегда движется по строгому линейному пути: она постоянно перепроверяет ответы и циклически уточняет решение, пока не получит релевантный результат.

Понял вас, учту на будущее, и чуть позже займусь и поправлю текст.

Хоть и проверял, но видимо недостаточно.

Это хороший вопрос!

У меня есть поверхностная статья про токены, там я ужедил внимание Векторам, можете там как раз почитать)

https://neiro-hub.ru/articles/10

Если в 2 словах, это необходимо, чтобы токены группировались по смыслу в многомерном пространстве. Но этот процесс уже происходит на стороне нейронки, когда мы её обучаем, так что подробнее напишу в следующий статье.

Если датасет у нас средний, и проходок мало, то токены буду только кусочками слов.

Например если зайти в токинизатор от Chat GPT, в старую версию 3.5, то получим разбивку не похожую на слова:

https://neiro-hub.ru/static/uploads/21c9231d7493a882.png

(с телефона фото не смог загрузить)

В новой версии 4o уже токен больше бъётся на слова.

В разных ответах, он по разному отвечает "в", "до"

На прямой ответ про 2022 год, он сказал, что имеет о нём информацию

Так же я решил позадавать ему вопросы про январь

Не буду утверждать, что он сказал верно, но то что я нашёл в интернете, как раз описывает январь

Только что проверил

Да, танцы с бубном остались((

Боюсь, в ближайшее время мы такой роскоши не получим, спасибо хоть за это

За него платить не надо, он бесплатный

Вы можете приобрести подписку Pluse, она даст доступ к 4 версии

Но для большинства задач хватает бесплатной версии

Убрал сайт по покупке SMS в блок спойлера, надеюсь теперь это не похоже на рекламу

Да я блин сам ради статьи сотку закинул!!!

Просто изначально на другом сайте покупал, у меня не работало и я просто деньги потратил, на этом всё работает

Я даже не писал как аккаунт регистрировать в нём, просто вскользь упомянул

И уточнил, что можно другоц использовать

Roman:
Мешает ли разнообразие стилей в статье восприятию или нет.

Chat GPT:
Ответ на этот вопрос может быть субъективным, так как восприятие стиля статьи может зависеть от предпочтений и опыта каждого читателя. Однако, в целом, разнообразие стилей в статье может иметь как положительное, так и отрицательное влияние на восприятие.

Положительное влияние разнообразия стилей в статье может заключаться в том, что оно может сделать текст более интересным и привлекательным для широкой аудитории. Разнообразие стилей может помочь привлечь внимание разных читателей, которые предпочитают разные стили письма. Это может сделать статью более доступной и понятной для разных групп людей.

Однако, слишком большое разнообразие стилей в статье может также затруднить восприятие и понимание текста. Если стили слишком сильно отличаются друг от друга, это может создать путаницу и затруднить понимание основной идеи статьи. Читатели могут испытывать трудности в переходе от одного стиля к другому и в адаптации к разным языковым и стилистическим особенностям.

Таким образом, разнообразие стилей в статье может быть полезным, если оно сбалансировано и помогает привлечь внимание разных читателей. Однако, слишком большое разнообразие стилей может затруднить восприятие и понимание текста.

——————————

Вещь субъективная:)

Так что я вас и спрашиваю

Нет, это моё кривое выделение) пытаюсь смысл подчеркнуть
Мешает?

Тут вынужден не согласится!

Писать большие проекты на нём не выйдет, НО небольшие сайты, функции или какие-то куски кода, выходит очень даже круто!

Тема большая и сложная, как-нибудь напишу статью на тему программирования с помощью Chat GPT.

А пока могу похвастаться сайтом, который я написал с помощью него.

Нет, я обычной пользователь

Купил изначально Plus, месяц им пользовался, потом перестал платить, сейчас его не имею

Доступ к gpt-4 есть, появился до плюса или после, не знаю

Могу сказать только на своём опыте.

У меня подписки Pluse нету уже 2 месяца, но подключится к апи gpt-4 могу.

Единственное, я не смог подключится к gpt-4-64k, но возможно для неё надо отдельный доступ запрашивать.

Я парсеров не много делал, с такой проблемой не сталкивался

Даже интересно будет с Chat GPT обсудить и сделать обход защиты от ботов:)

Статья интересная!

Но эта о другом, тут мы руками код сайта впихиваем

И это не обучение)

Нет, эта статья не о том)

Хотя тема интересная!

Я знал о библиотеке tiktoken, но решил не включать о ней информацию, так как не хотел перегружать статью.

Да, tiktoken подойдёт, чтобы примерно рассчитать, сколько стоит размер потенциального запроса, но это будет только приблизительный подсчёт!

Во-первых, данный расчёт не точен. Да, погрешность небольшая, но если мы пишем сервис и считаем затраты, то через месяц мы можем быть неприятно удивлены, что затраты превысили посчитанные.

Во-вторых, данный метод не даёт нам возможности посчитать, сколько будет стоить запрос целиком, так как мы платим не только за количество токенов на входные данные, но и за количество токенов, затраченных на генерацию ответа, причем по цене выше, чем запрос. Да, обычно на ответ тратится намного меньше токенов, но это будет зависеть от запроса. И быть на 100% уверенным, сколько будет затрачено токенов на запрос, невозможно. Мы можем узнать, сколько было потрачено токенов на формирование ответа по факту, получив число в ответе.

Для себя я начал применять его в обучающих целях.

Например даю ему установку, чтобы он задавал вопросы по программированию уровня Middle и Senior, и если не знаю ответа, то прошу его подробнее рассказать.

Ещё общаюсь с ним на Английском языке для практики.

Это можно делать и в обычном чате, понимаю, но каждый раз настраивать, это не так уж и удобно, мне проще один раз настроить всё основательно, сделать простой сайтик и пользоваться.

Information

Rating
1,593-rd
Location
Россия
Registered
Activity