И получил даже от неё очень хороший ответ, даже без обдумывания.
Так как она обучена на каласальном объёме данных, то в ней уже есть примеры как кодированный текст превращается в обычный и наоборот, и просто на основе этого она может кодировать и декодировать текст на лету, даже не обдумывая.
Но на этом решил не остановить, и зашифровал через ключ. Версия 4o не справилась. 5 версия без обдумывания дала ответ сразу.
Думаю, что если взять и создать нейронку чисто под задачи шифрования, она порвёт всё и вся. Возможно такое даже уже есть.
Thinking — это не сама нейросеть, а алгоритм, который решает поставленную задачу через неё.
Текст, который мы отправляем в нейросеть, прогоняется через неё несколько раз с разными параметрами. Как именно — зависит от алгоритма на стороне платформы, но в целом это выглядит так:
Ставится задача: разбить введённый текст на пул подзадач — что нужно сделать и что в итоге получить.
Каждый элемент пула обрабатывается отдельно, и мы получаем результаты.
Все полученные результаты собираются и ещё раз отправляются в нейросеть, чтобы на основе всей совокупности информации получить ответ.
Так и происходит «обдумывание». Кроме того, нейросеть не всегда движется по строгому линейному пути: она постоянно перепроверяет ответы и циклически уточняет решение, пока не получит релевантный результат.
Если в 2 словах, это необходимо, чтобы токены группировались по смыслу в многомерном пространстве. Но этот процесс уже происходит на стороне нейронки, когда мы её обучаем, так что подробнее напишу в следующий статье.
Roman: Мешает ли разнообразие стилей в статье восприятию или нет.
Chat GPT: Ответ на этот вопрос может быть субъективным, так как восприятие стиля статьи может зависеть от предпочтений и опыта каждого читателя. Однако, в целом, разнообразие стилей в статье может иметь как положительное, так и отрицательное влияние на восприятие.
Положительное влияние разнообразия стилей в статье может заключаться в том, что оно может сделать текст более интересным и привлекательным для широкой аудитории. Разнообразие стилей может помочь привлечь внимание разных читателей, которые предпочитают разные стили письма. Это может сделать статью более доступной и понятной для разных групп людей.
Однако, слишком большое разнообразие стилей в статье может также затруднить восприятие и понимание текста. Если стили слишком сильно отличаются друг от друга, это может создать путаницу и затруднить понимание основной идеи статьи. Читатели могут испытывать трудности в переходе от одного стиля к другому и в адаптации к разным языковым и стилистическим особенностям.
Таким образом, разнообразие стилей в статье может быть полезным, если оно сбалансировано и помогает привлечь внимание разных читателей. Однако, слишком большое разнообразие стилей может затруднить восприятие и понимание текста.
Я знал о библиотеке tiktoken, но решил не включать о ней информацию, так как не хотел перегружать статью.
Да, tiktoken подойдёт, чтобы примерно рассчитать, сколько стоит размер потенциального запроса, но это будет только приблизительный подсчёт!
Во-первых, данный расчёт не точен. Да, погрешность небольшая, но если мы пишем сервис и считаем затраты, то через месяц мы можем быть неприятно удивлены, что затраты превысили посчитанные.
Во-вторых, данный метод не даёт нам возможности посчитать, сколько будет стоить запрос целиком, так как мы платим не только за количество токенов на входные данные, но и за количество токенов, затраченных на генерацию ответа, причем по цене выше, чем запрос. Да, обычно на ответ тратится намного меньше токенов, но это будет зависеть от запроса. И быть на 100% уверенным, сколько будет затрачено токенов на запрос, невозможно. Мы можем узнать, сколько было потрачено токенов на формирование ответа по факту, получив число в ответе.
Например даю ему установку, чтобы он задавал вопросы по программированию уровня Middle и Senior, и если не знаю ответа, то прошу его подробнее рассказать.
Ещё общаюсь с ним на Английском языке для практики.
Это можно делать и в обычном чате, понимаю, но каждый раз настраивать, это не так уж и удобно, мне проще один раз настроить всё основательно, сделать простой сайтик и пользоваться.
Специально взял модель постарше!
И получил даже от неё очень хороший ответ, даже без обдумывания.
Так как она обучена на каласальном объёме данных, то в ней уже есть примеры как кодированный текст превращается в обычный и наоборот, и просто на основе этого она может кодировать и декодировать текст на лету, даже не обдумывая.
Но на этом решил не остановить, и зашифровал через ключ.
Версия 4o не справилась.
5 версия без обдумывания дала ответ сразу.
Думаю, что если взять и создать нейронку чисто под задачи шифрования, она порвёт всё и вся. Возможно такое даже уже есть.
Вы правы!
Спасибо за пример!
Thinking — это не сама нейросеть, а алгоритм, который решает поставленную задачу через неё.
Текст, который мы отправляем в нейросеть, прогоняется через неё несколько раз с разными параметрами. Как именно — зависит от алгоритма на стороне платформы, но в целом это выглядит так:
Ставится задача: разбить введённый текст на пул подзадач — что нужно сделать и что в итоге получить.
Каждый элемент пула обрабатывается отдельно, и мы получаем результаты.
Все полученные результаты собираются и ещё раз отправляются в нейросеть, чтобы на основе всей совокупности информации получить ответ.
Так и происходит «обдумывание».
Кроме того, нейросеть не всегда движется по строгому линейному пути: она постоянно перепроверяет ответы и циклически уточняет решение, пока не получит релевантный результат.
Понял вас, учту на будущее, и чуть позже займусь и поправлю текст.
Хоть и проверял, но видимо недостаточно.
Это хороший вопрос!
У меня есть поверхностная статья про токены, там я ужедил внимание Векторам, можете там как раз почитать)
https://neiro-hub.ru/articles/10
Если в 2 словах, это необходимо, чтобы токены группировались по смыслу в многомерном пространстве. Но этот процесс уже происходит на стороне нейронки, когда мы её обучаем, так что подробнее напишу в следующий статье.
Если датасет у нас средний, и проходок мало, то токены буду только кусочками слов.
Например если зайти в токинизатор от Chat GPT, в старую версию 3.5, то получим разбивку не похожую на слова:
https://neiro-hub.ru/static/uploads/21c9231d7493a882.png
(с телефона фото не смог загрузить)
В новой версии 4o уже токен больше бъётся на слова.
В разных ответах, он по разному отвечает "в", "до"
На прямой ответ про 2022 год, он сказал, что имеет о нём информацию
Так же я решил позадавать ему вопросы про январь
Не буду утверждать, что он сказал верно, но то что я нашёл в интернете, как раз описывает январь
Только что проверил
Да, танцы с бубном остались((
Боюсь, в ближайшее время мы такой роскоши не получим, спасибо хоть за это
За него платить не надо, он бесплатный
Вы можете приобрести подписку Pluse, она даст доступ к 4 версии
Но для большинства задач хватает бесплатной версии
Убрал сайт по покупке SMS в блок спойлера, надеюсь теперь это не похоже на рекламу
Да я блин сам ради статьи сотку закинул!!!
Просто изначально на другом сайте покупал, у меня не работало и я просто деньги потратил, на этом всё работает
Я даже не писал как аккаунт регистрировать в нём, просто вскользь упомянул
И уточнил, что можно другоц использовать
Roman:
Мешает ли разнообразие стилей в статье восприятию или нет.
Chat GPT:
Ответ на этот вопрос может быть субъективным, так как восприятие стиля статьи может зависеть от предпочтений и опыта каждого читателя. Однако, в целом, разнообразие стилей в статье может иметь как положительное, так и отрицательное влияние на восприятие.
Положительное влияние разнообразия стилей в статье может заключаться в том, что оно может сделать текст более интересным и привлекательным для широкой аудитории. Разнообразие стилей может помочь привлечь внимание разных читателей, которые предпочитают разные стили письма. Это может сделать статью более доступной и понятной для разных групп людей.
Однако, слишком большое разнообразие стилей в статье может также затруднить восприятие и понимание текста. Если стили слишком сильно отличаются друг от друга, это может создать путаницу и затруднить понимание основной идеи статьи. Читатели могут испытывать трудности в переходе от одного стиля к другому и в адаптации к разным языковым и стилистическим особенностям.
Таким образом, разнообразие стилей в статье может быть полезным, если оно сбалансировано и помогает привлечь внимание разных читателей. Однако, слишком большое разнообразие стилей может затруднить восприятие и понимание текста.
——————————
Вещь субъективная:)
Так что я вас и спрашиваю
Нет, это моё кривое выделение) пытаюсь смысл подчеркнуть
Мешает?
Тут вынужден не согласится!
Писать большие проекты на нём не выйдет, НО небольшие сайты, функции или какие-то куски кода, выходит очень даже круто!
Тема большая и сложная, как-нибудь напишу статью на тему программирования с помощью Chat GPT.
А пока могу похвастаться сайтом, который я написал с помощью него.
Нет, я обычной пользователь
Купил изначально Plus, месяц им пользовался, потом перестал платить, сейчас его не имею
Доступ к gpt-4 есть, появился до плюса или после, не знаю
Могу сказать только на своём опыте.
У меня подписки Pluse нету уже 2 месяца, но подключится к апи gpt-4 могу.
Единственное, я не смог подключится к gpt-4-64k, но возможно для неё надо отдельный доступ запрашивать.
Я парсеров не много делал, с такой проблемой не сталкивался
Даже интересно будет с Chat GPT обсудить и сделать обход защиты от ботов:)
Статья интересная!
Но эта о другом, тут мы руками код сайта впихиваем
И это не обучение)
Нет, эта статья не о том)
Хотя тема интересная!
Я знал о библиотеке tiktoken, но решил не включать о ней информацию, так как не хотел перегружать статью.
Да, tiktoken подойдёт, чтобы примерно рассчитать, сколько стоит размер потенциального запроса, но это будет только приблизительный подсчёт!
Во-первых, данный расчёт не точен. Да, погрешность небольшая, но если мы пишем сервис и считаем затраты, то через месяц мы можем быть неприятно удивлены, что затраты превысили посчитанные.
Во-вторых, данный метод не даёт нам возможности посчитать, сколько будет стоить запрос целиком, так как мы платим не только за количество токенов на входные данные, но и за количество токенов, затраченных на генерацию ответа, причем по цене выше, чем запрос. Да, обычно на ответ тратится намного меньше токенов, но это будет зависеть от запроса. И быть на 100% уверенным, сколько будет затрачено токенов на запрос, невозможно. Мы можем узнать, сколько было потрачено токенов на формирование ответа по факту, получив число в ответе.
Для себя я начал применять его в обучающих целях.
Например даю ему установку, чтобы он задавал вопросы по программированию уровня Middle и Senior, и если не знаю ответа, то прошу его подробнее рассказать.
Ещё общаюсь с ним на Английском языке для практики.
Это можно делать и в обычном чате, понимаю, но каждый раз настраивать, это не так уж и удобно, мне проще один раз настроить всё основательно, сделать простой сайтик и пользоваться.