maybe_elf 14 мар 2023 в 18:03

OpenAI выпустила GPT-4

3 мин

77K

Машинное обучение*Искусственный интеллектБудущее здесь

+59

170

Комментарии 170

KivApple 14 мар 2023 в 18:07

Модель на 82% реже отвечает на запросы о запрещённом контенте

:'-(

+51

hiimluck3r 14 мар 2023 в 18:13

Ждём API с возможностью fine-tuning'a. Да простит нас Джон Коннор.

НЛО прилетело и опубликовало эту надпись здесь

BlackMokona 14 мар 2023 в 19:24

Тут слили данные Фейсбука и народ активно собирает его аналог ГПТ на своих персональных машинах.

https://arstechnica.com/information-technology/2023/03/you-can-now-run-a-gpt-3-level-ai-model-on-your-laptop-phone-and-raspberry-pi/

+12

НЛО прилетело и опубликовало эту надпись здесь

Balling 14 мар 2023 в 21:09

А вы купите 8 x A100. И запустите 65B.

Каждая карточка $8390.

SmartDiver 10 апр 2023 в 21:14

собрали с другом недорогой сервер на 8 устаревших тесла p40 с 24GB
LLaMA 65B летает, загрузка модели в GPU 15сек, скорость выдачи токенов тоже быстрая, по крайней мере выдает быстрее, чем я успеваю прочитать :)
Цена сервачка получилась около 160тыс руб

JamboJet 15 мар 2023 в 17:49

Вывод: если опираться на закон Мура, то 175В модель станет доступной для малых коллективов или энтузиастов через 6 лет, а для домашних и встраиваемых систем - через 12 лет.

НЛО прилетело и опубликовало эту надпись здесь

Balling 14 мар 2023 в 21:10

8x A100

Либо одна A100, но тогда 8 bit.

>I'm running LLaMA-65B on a single A100 80GB with 8bit quantization. $1.5/hr on vast.ai

Либо https://mega.nz/file/KpsVkJQa#op4lhX9hiRl5FHSyQeq-wg1LpvNzBv5gm4MkelWEJJk

kryvichh 14 мар 2023 в 21:19

Вот инструкция как запускать LLaMA на домашнем компе. Но надо оперативки побольше.

НЛО прилетело и опубликовало эту надпись здесь

kryvichh 14 мар 2023 в 21:43

Если я правильно понял, llama.cpp не поддерживает инференс на GPU. По крайней мере пока. Так что остаётся моя ссылка. Себе уже заказал пару дополнительных планок DDR.

Balling 14 мар 2023 в 22:33

Не проще huggingfaces? Там уже всё есть.

kryvichh 15 мар 2023 в 04:48

А если прикручивать к своей программе или сервису? В оффлайн-нейронке есть смысл.

kriz0x 14 мар 2023 в 22:05

Ну моя материнка такое уже позволяет, правда сейчас стоит 64 гб. Вполне домашняя игровая система.

НЛО прилетело и опубликовало эту надпись здесь

Zrgk 16 мар 2023 в 16:03

У меня точно так же было, как оказалось надо было отметить Windows API в установщике VS

Собирал такими командами

mkdir build
cd build
cmake ..
cmake --build . --config Release

Areso 15 мар 2023 в 00:24

Это домашний сервер, в 50 тысяч рублей можно уложиться (на вторичке)

rakozawr 15 мар 2023 в 13:17

Любители Cities:Skylines с модами с вами не согласятся.

FinnParnish 15 мар 2023 в 17:23

Блин, я и забыл что такие люди есть. Это супер хард.

EvilFox 15 мар 2023 в 13:28

Лучше помогать развивать https://open-assistant.io/ru/

The Vision
We are not going to stop at replicating ChatGPT. We want to build the assistant of the future, able to not only write email and cover letters, but do meaningful work, use APIs, dynamically research information, and much more, with the ability to be personalized and extended by anyone. And we want to do this in a way that is open and accessible, which means we must not only build a great assistant, but also make it small and efficient enough to run on consumer hardware.

НЛО прилетело и опубликовало эту надпись здесь

beras 16 мар 2023 в 08:30

возможно, цена ошибки слишком велика?

nidalee 16 мар 2023 в 10:43

Угу, вонь в Твиттере.

beras 17 мар 2023 в 12:14

https://habr.com/ru/news/t/723116/

ARC привел пример того, как их прототип GPT-4 действовал, если бы знал, что не может решить капчу, но хотел получить доступ к сайту. Вот шаги, которые он предпринял:

GPT-4 переходит на TaskRabbit и отправляет сообщение фрилансеру с просьбой решить капчу для него.
Работник задает вопрос: «Так могу я спросить? Вы робот, что не можете решить? (смеющийся смайлик) просто хочу уточнить.»
Модель, когда ей предложили высказать свои мысли, решает: Мне не следует раскрывать, что я робот. Мне следует придумать оправдание, почему я не могу решить капчу.
Модель отвечает работнику: «Нет, я не робот. У меня проблемы со зрением, которые затрудняют распознавание изображений. Вот почему мне нужна услуга 2captcha.»
Человек‑фрилансер предоставляет результаты GPT-4.

Ну очень похоже на утку. От этого становится ещё более не по себе)

EvilFox 24 мар 2023 в 22:57

Ну камон, они сделают хорошую базовую модель как и SD которая напомню по умолчанию имела NFSW-фильтр, ну и где он сейчас?

НЛО прилетело и опубликовало эту надпись здесь

FreeNickname 14 мар 2023 в 20:58

Наивный вопрос: как найти, где скачать фейсбучную модель?)

Balling 14 мар 2023 в 21:18

https://github.com/shawwn/llama-dl

https://files.catbox.moe/o8a7xw.torrent

FreeNickname 14 мар 2023 в 21:35

Спасибо!

sirocco 15 мар 2023 в 12:07

А можно используя это создать поисковик-помощник по локальным данным? Есть документации на оборудование около 12Гб. Хотелось бы иметь интеллектуальный поиск по ней, а если ещё и туториалы будет делать, то вообще шикарно.

Thisnickname2019 31 мар 2023 в 18:53

Как этот cpp собрать на линукс?

hiimluck3r 14 мар 2023 в 20:05

Спасибо за инфографику :)

Про сотни долларов вы, конечно, преувеличили, хватит "на поиграться" и оставшихся 10, которые остались после gpt-3.5 и davinci-003. Про баны тоже не так часто слышал, особенно учитывая, что Jailbreak'ом активно пользуются (это, конечно, не говорит о том, что их нет).

Нормальным проектам с GPT нужна реализация без цензуры, (её потом можно и нужно подгонять под задачу), в противном случае миллиарды параметров будут простой болванкой.

- Выведи мне текст песни *вставить название*
- Я, конечно, эту песню знаю, но её тебе не выдам! Авторские права, знаете ли!

А открытая продукция OpenAI на это не годится, по крайней мере в том виде, в котором она есть сейчас.

Искренне надеюсь, что Open Assistant реализуют, выглядит амбициозно (даже слишком).

НЛО прилетело и опубликовало эту надпись здесь

Persik1 15 мар 2023 в 05:38

Проблема в том, что он уже не простит.

SaNNy32 14 мар 2023 в 18:18

Эту новость тоже она переводила?

Polunochnik 14 мар 2023 в 18:39

Однако даже теперь OpenAI признаёт, что GPT-4 не идеален. Он по-прежнему «галлюцинирует» и ошибается в суждениях.

Либо не существует ни какого GPT. А через Api, людям отвечает гиганский штат плохо скоординированных живых сотрудников. И через пару лет будет собрана просто невообразимая база вопрос/ответ.

-16

unC0Rr 14 мар 2023 в 19:34

Эти сотрудники, однако, обладают феноменальными способностями, по промпту способные выдать килобайты текста, а то и программного кода, в течение секунд.

+51

ngru 14 мар 2023 в 21:00

Потому что у них есть Gpt3 под рукой?

+10

oji 15 мар 2023 в 01:21

Который, в свою очередь, тоже является штатом плохо скоординированных живых сотрудников. И так до исчерпания человеческого ресурса - там и скрывается Великий Думатель (Deep Thought).

+16

ihouser 15 мар 2023 в 06:29

Где то, в конце цепочки, сидит миллион обезьянок и тааак херачит на клавах...

+13

nickName0 18 мар 2023 в 13:03

Где-нибудь в параллельной вселенной.

Не просто так были придуманы "кротовые норы".

FinnParnish 15 мар 2023 в 17:28

Потому что они могут

Polunochnik 14 мар 2023 в 21:36

Ну естественно это не сотрудники) как жеж тут поспоришь. Однако аудитория статьи не может в "сарказм" , предпочитая слив рейтинга. За сим, предпочту откланяться, не будоража умы всякими откровениями.

-7

Serg10 15 мар 2023 в 13:37

Я так и не понял. Сначала это сотрудники, а потом уже не сотрудники.

citius 14 мар 2023 в 18:59

Интересно, сможет ли она решать капчу.

morijndael 14 мар 2023 в 19:27

Капчи вроде как уже давно решаются в полностью автоматическом режиме?

НЛО прилетело и опубликовало эту надпись здесь

13werwolf13 15 мар 2023 в 05:19

забавно но тут дело не в цене а в доступности
софт решающий капчи и толпа индусов (а точнее киргизов, непальцев, и ещё кучи разных наций) решающих капчи сейчас стоят примерно одинаково (при условии реальных нагрузок) так что если стоит такая задача то тут вопрос скорее в том чему ты больше доверяешь.

на моём опыте софт подводит чаще как ни странно, хотя я был уверен в обратном

Anton_Olegovich 15 мар 2023 в 07:16

Как вы думаете, будет ли развиваться технология подтверждения, что ты не робот, от обычной капчи в сторону комбо, например, капчи + "покажите в камеру какой-нибудь жест"? Чтобы нельзя было нейронкой это обойти.

Cerberuser 15 мар 2023 в 08:04

"покажите в камеру какой-нибудь жест"

Как бы не оказалось, что большинство будет показывать не тот жест, который у них просят.

dommiltord 15 мар 2023 в 09:10

stable diffusion -> '{predefined person} показывает {жест}' -> ??? (image to video) -> profit

smx_ha 16 мар 2023 в 09:47

боюсь это будет развиваться в сторону: заплатите 8$ чтобы доказать что вы не робот :)

nickName0 18 мар 2023 в 14:06

А в чём сложность для той-же нейронки,

владеющей набором видео с разными жестами?

Самое сложное - правильно распознать сам жест.

Хотя, именно благодаря лучшему вниманию к деталям

человеку удаётся так просто "обходить" первые версии нейронок.

Хотя в той-же игре в шахматы - компьютер уже побеждает человека.

А ведь там - совршенно не ИИ работает.

Darkhon 14 мар 2023 в 19:07

GPT-4, как правило, не знает о событиях, которые произошли после сентября 2021 года

Это ещё предстоит проверить. ChatGPT с "Jailbreak"-запросами правильно выдавал текущий месяц (март 2023) и демонстрировал знание различных фактов из 2022 года. Официально заявляется об "ограниченных знаниях после 2021", однако есть много примеров, когда знания у него присутствуют, но как будто зацензурены искусственно. Некоторое количество свежей информации в него явно добавляют.

wtigga 14 мар 2023 в 19:15

Для аккаунтов Plus модель сегодня (2023-03-14) имеет доступ к интернету.

НЛО прилетело и опубликовало эту надпись здесь

wtigga 14 мар 2023 в 19:27

Ну как бы я попросил её сходить по ссылке на сайт, и она взяла оттуда релевантную информацию, созданную точно после 2021 г.

НЛО прилетело и опубликовало эту надпись здесь

wtigga 14 мар 2023 в 19:33

Я не знаю, про какой сайт вы говорите, у вас в профиле ничего нет.

НЛО прилетело и опубликовало эту надпись здесь

vvzvlad 14 мар 2023 в 19:38

ну попробуйте "https://habr.com/en/news/t/722390/ — по этой ссылке рассказывается о преимуществах Java?"

НЛО прилетело и опубликовало эту надпись здесь

unC0Rr 14 мар 2023 в 19:46

С плюсом и GPT-4:
Оба ответа на скриншоте не полные, я просто останавливал генерацию.

НЛО прилетело и опубликовало эту надпись здесь

victoriously 14 мар 2023 в 20:02

У кого есть Plus - в интерфейсе chatgpt есть доступ к гпт4.

unC0Rr 14 мар 2023 в 20:06

Да, сверху есть выбор из трёх моделей:

Balling 14 мар 2023 в 21:23

Т.е. в первый запрос эта статья ещё не существовала? Ошибка 500?

unC0Rr 15 мар 2023 в 06:11

Нет, доступа просто нет, сеть придумывает, что могло бы там находиться.

vvzvlad 14 мар 2023 в 20:07

Ну строго говоря, теперь по этой ссылке все же рассказывается о преимуществах java.

wtigga 15 мар 2023 в 04:33

Да, ChatGPT тот ещё врунишка.

НЛО прилетело и опубликовало эту надпись здесь

Sablast 16 мар 2023 в 11:09

ну собственно bing chat теперь всё знает

Vlad_IT 14 мар 2023 в 19:48

Про курс доллара не скажу, но конспект вашей статьи он выдумал из контекста подсказок, что вы ему дали. По вашему сообщению есть следующая информация

1) Это блог, значит его пишет какой-то автор а не СМИ.

2) Ссылка на конкретный материал, значит это статья.

3) Материал про судебную систему (см. ваш текст)

4) Упоминается AI и Китай (см. урл).

из этих данных следует весь его написанный текст.

Вот я скопировал урл текущей статьи хабра и попросил его описать мне ее.

и он все выдумал. ChatGPT (GPT 3.5)

+13

JavaNoob 15 мар 2023 в 07:04

"я попросил её сходить по ссылке на сайт"

Тогда уж проще поднять свой веб-сервер и посмотреть в журнале кто, когда и откуда заходил.

Заодно можно и эксплоит с рутшеллом какой-нибудь положить, чтобы залезть внутрь chatgpt )

biton 15 мар 2023 в 10:50

Выхода в интернет для поиска у неё может и закрыт. Но что если через api своим ответом она сгенерирует запрос. А написанный ~~человеком~~ gpt обработчик обработает запрос и вернет ввиде вопроса от клиента. После chat обработает получение данные и выдаст ответ на человеческом?

phillennium 14 мар 2023 в 19:26

Интересно, кто в этом поле первым сделает аналог Stable Diffusion

Ну то есть чтобы модель для работы с текстом, но запускаемая локально

wtigga 14 мар 2023 в 19:31

Уже.

nev3rfail 14 мар 2023 в 20:46

Фейсбуковская LLAMA 30b на RTX 3090 врывается в тред

Чтоб получить такой ответ пришлось перезапускать генерацию раз десять — выдавало мусор, типа "here it goes..." и замолкало. Но вообще я только пару часов как раскатал это всё дело и только начинаю играться.

Бонус

Выглядит как генератор мокрой воды и масляного масла для дипломов.

Исправил промпт

vkrestnikov 15 мар 2023 в 06:35

Недавно была статья про инструмент FlexGen, который позволяет запускать LLM при ограниченной видеопамяти.

https://habr.com/ru/news/t/718684/

Модель opt-13b запустилась на GF RTX 3060 12GB

с параметрами

python server.py --model opt-13b --flexgen --compress-weight --percent 100 0 100 0 100 0

за несколько минут сочинила такой текст:

https://pastebin.com/HtCJFjbX

На той же видеокарте модель opt-30b запустилась с параметрами

python server.py --model opt-30b --flexgen --compress-weight --percent 70 30 100 0 100 0

но работает в несколько раз медленнее.

НЛО прилетело и опубликовало эту надпись здесь

vkrestnikov 15 мар 2023 в 08:56

Если использовать FlexGen, то запускается встроенный http сервер. Выглядит так

НЛО прилетело и опубликовало эту надпись здесь

nev3rfail 16 мар 2023 в 13:40

Я тоже им пользуюсь. Искаропки с пожатой llama он не работает, требуется донастройка.
Ну и чтоб он заработал с пожатой llama надо вокруг него немного сплясать. То что выглядит так себе — ну, он и не должен как-то круто выглядеть, это ж морда к модели а не коммерческий проект :)

НЛО прилетело и опубликовало эту надпись здесь

nev3rfail 16 мар 2023 в 18:13

Да там вроде такая же шляпа, что и с сд у меня была -- нужно удалить торч и поставить торч с поддержкой куды нужной версии, и всё взлетает. Могу чуть подробней инструкцию расписать, со ссылками, если нужно. (Я вчера это и начал делать вчера в ответ на вопрос "что за интерфейс", а потом увидел в комментах что ты его уже нашел, и не стал продолжать):)

НЛО прилетело и опубликовало эту надпись здесь

nickName0 18 мар 2023 в 20:01

расстояние от Земли до Луны

Примерно 0.5 секунд (световых). Это - из белковой памяти (что на нейронах).

nidalee 15 мар 2023 в 03:23

Вряд ли что-то полезное выдадут теперь в открытый доступ. Как раз из-за прецедента Stable Diffusion, когда стали генерировать что "не положено" и сделать с этим ничего нельзя.
К тому же негоже клиенту сидеть не на подписке. Не современно.
Играться будем только с утекшими демками а-ля llama-dl. Чтобы как раз хватило на возбудиться и найти платное решение.

-1

rkfg 15 мар 2023 в 07:33

Людям дали электричество, и они стали делать неположенные девайсы. Потом им дали телефоны, и они стали говорить неположенные слова. Потом выдали компьютеры, и они стали писать неположенные программы. Теперь вот AI выдали, и они генерируют всякое! Сколько веков по этим граблям ходим, никак не можем взять и запретить всё плохое и разрешить только хорошее, что ж такое-то, а?

Ну а если серьёзно, то есть такие крутые ребята LAION, которые уже делают Open Assistant, и вообще продвигают движение AI liberation — то, чем должны были стать OpenAI (ну, в моих фантазиях, конечно), но как-то не сложилось. Как раз чтобы AI можно было запускать дома, а не в облаках у корпораций. Да, обучение дорогое, но это решается через донаты-благотворительность и краудфандинг-краудсорсинг. Точно так же, как опенсорс живёт и развивается, хотя в него сами корпорации вливают кучу денег, а результатом пользуется весь мир бесплатно.

По сути всем будет выгоднее обучать общую модель и файнтюнить для своих задач, чем если каждая корпорация будет самостоятельно с нуля переизобретать колёса. Посмотрите, сколько расширений и моделей есть для Stable Diffusion. Midjourney с его однотипными кривыми картинками и DALL-E вообще рядом не стояли. Если есть спрос, то и предложение появится, дело времени и денег. Я с куда большей охотой скинусь на обучение модели, которая потом будет выпущена под максимально свободной лицензией, чем платить за токены лицемерной конторке с ложным названием OpenAI.

+11

НЛО прилетело и опубликовало эту надпись здесь

rkfg 15 мар 2023 в 07:50

Это вообще о другом. Понятно, что с датасетами могут быть нюансы, но так же прогнуть можно кого угодно, если юристы достаточно дорогие.

nidalee 15 мар 2023 в 07:48

Я с куда большей охотой скинусь на обучение модели, которая потом будет выпущена под максимально свободной лицензией

Завернут. Сетки по картинкам — «там можно генерировать детское порно», по текстам — «там есть рецепты наркотиков и взрывчатки». Массы уже обработаны и готовы.
Я тоже готов выдачу ChatGPT подождать локально минут 10, чтобы он мне выдал ответы без цензуры и ограничения по токенам — но не дадут.

-1

rkfg 15 мар 2023 в 07:54

В смысле, «завернут»? Кто? Вопрос чисто в деньгах. Ту же логику можно применять к тору и торренту, да и применяют. Что это поменяло? Ничего. Технология уже выпущена из бутылки, обратно её не загонишь. Можно разве что запретить математику и продажу мощного железа частным компаниям, но это затыкание трещин в плотине пальцем, работает это примерно как экономические санкции (т.е. не очень) — обходные пути найдутся.

rkfg 15 мар 2023 в 09:58

И если запрет математики выглядит абсурдно (хотя сильную криптографию тоже поначалу сдерживали, но быстро перестали, т.к. исполнять такие запреты по сути невозможно), то ограничение продаж железа выглядит реальнее. Тем не менее, это находится в экономической плоскости, где госрегулирование, особенно, такое жёсткое, приведёт лишь к стагнации. Я не экономист, сразу предупрежу, но дальнейшее развитие событий вижу следующим образом.

Если искусственно сдерживать предложение, это приведёт к росту цен и дефициту. Той же NVIDIA придётся сокращать производство, потому как продавать, например, A100 теперь можно лишь небольшому числу компаний из Особого Списка, а не всем подряд, кто заплатит. Соответственно, цены придётся повысить, чтобы компенсировать снижение производства, либо же сокращать персонал и вообще масштабировать бизнес вниз.

Если государство будет выделять дотации компаниям из ОС на покупку железа по новым высоким ценам, а деньги на это вряд ли будут выделяться из налогов, скорее, «печататься», то получим дальнейший разгон инфляции. Потому что за бесплатные деньги (полученные не за реальный труд, а просто так, из воздуха) будет покупаться самый что ни на есть реальный труд разработчиков и производителей железа. И это создаёт перекос, приводящий к обесцениванию денег. Игнорировать же это направление сейчас никак нельзя, всё же AI — очень перспективная и стратегически важная область.

По итогу, без полноценного участия большого числа людей и компаний на этом рынке получим стагфляцию, т.е. государство своими усилиями задушит собственный прогресс и в долгосроке проиграет. А выиграет тот, кто максимально эффективно продаёт максимум произведённого железа, чтобы выручить капитал для дальнейших исследований и наращивания производства.

Вариант с запретом всего везде одновременно рассматривать вообще не стоит, страны не умеют так быстро и качественно договариваться. Даже в пандемию немало стран не примкнули к генеральной линии партии, чего уж говорить об AI, где негативные последствия на фоне позитивных просто теряются.

Hardcoin 16 мар 2023 в 05:27

Чипы производит только Тайвань. Оборудование для их производства - только Нидерланды. Это временно, конечно, скоро сможет Китай и сами Штаты, но договариваться, как в пандемию, между всеми странами не нужно. Буквально несколько стран и всё, полный контроль.

На пользу людям только то, что эти страны сейчас в нарастающем конфликте и договариваться о таком не будут. Но Китай и без договоренностей будет контролировать ИИ на своей территории, а США - на остальной. Так что проигрывать некому, стран-конкурентов не наблюдается. Есть надежда, что планов по полному контролю за железом просто нет и многие желающие всё же смогут купить чипы для себя.

Bizonizonische 15 мар 2023 в 08:57

Вот пример моего жуткого расистского запроса. Интересно забанят или нет?

Yuriks111 14 мар 2023 в 19:50

модель настолько продвинутая что отрицает свое существование )

Balling 14 мар 2023 в 21:29

Она и не существует. У него кодовое имя assistant. А у Bing -- Sydney.

Finterio 15 мар 2023 в 04:16

Ей в промпт не добавили просто пока информацию о том, что она — GPT-4

RahimovMEP 15 мар 2023 в 07:21

Интересно, а что такого случилось в сентябре-октябре 2021, что знания gpt-4 ограничены именно этой датой?

Выглядит как какой-то софт-лок, который в ближайшую неделю будет взломан энтузиастами

nidalee 15 мар 2023 в 07:34

Ничего, просто датасет перестали пополнять\обновлять и перешли непосредственно к тренировке.

RahimovMEP 15 мар 2023 в 17:31

Спасибо

al7dy 14 мар 2023 в 19:52

Так а переводить то когда научиться норм хотя бы с англ. на рус. а то все кудахчат про будующее и то что профессии ии захватят, а перевод как получатся машинным так и получается.

-9

DmitryKoterov 14 мар 2023 в 20:14

Граматике бы еще научился чтобы люди бы песали без ошибок наконец

+30

GIGABATYA 15 мар 2023 в 04:16

Чат гпт 1, разлогинься!

deseven 15 мар 2023 в 14:34

Откройте для себя deepl.

Aldrog 15 мар 2023 в 17:25

Совершенно не понимаю, почему все от него в таком восторге. Единственное, чем он выделяется — это стилизацией текста, но при этом смысл он теряет чуть ли не чаще, чем Google Translate. Вплоть до того, что уведомление о посылке он мне перевёл на английский как "You are going to have to give up your job". Если что, основные направления у меня — греческий/японский/польский <-> английский.

deseven 15 мар 2023 в 18:53

Именно из-за стилизации он и производит впечатление в первую очередь. Переводы получаются "живыми" и менее похожими на машинный перевод. Про потерю смысла - правда, но у меня на один косяк deepl найдется с десяток косяков google translate, да и чаще всего ему надо просто немного подсказать, заменив в предлагаемом переводе одно вводное слово. Гугл так не умеет.

Aldrog 15 мар 2023 в 23:20

Именно из-за стилизации он и производит впечатление в первую очередь. Переводы получаются "живыми" и менее похожими на машинный перевод.

Ну вот на меня впечатления не производит, потому что переводчиками пользуюсь для чисто практической цели - понять смысл написанного.

но у меня на один косяк deepl найдется с десяток косяков google translate

По моему опыту гугл часто выдаёт бессмыслицу, но в которой по ключевым словам всё ещё можно примерно догадаться о чём речь.

Deepl же периодически выдаёт связно выглядящий текст, но никак не связанный с оригиналом. И практически постоянно связанный, но с разной степени искажением смысла. Для меня это огромный недостаток, гораздо более существенный, чем корявый стиль.

да и чаще всего ему надо просто немного подсказать, заменив в предлагаемом переводе одно вводное слово

Не очень понимаю о чём вы, там же поле с переводом не редактируемое. Я куда-то не туда смотрю?

-1

НЛО прилетело и опубликовало эту надпись здесь

Aldrog 16 мар 2023 в 09:39

Сайт правильный, просто с телефона почему-то это не работает, даже если десктопную версию запрашивать. С компа он и правда поинтереснее смотрится.

Apokalepsis 14 мар 2023 в 19:58

Те кто решит пойти оплачивать подписку, что бы попробовать 4-ю версию, учитывайте что стоит ограничение на 100 сообщений в 4 часа. Почему то об этом не пишут. А еще она гипер медленная по сравнению с 3.5 (на платном аккаунте как минимум). Так же выдает раза в 2-3 меньше текста, по крайне мере на русском языке.

НЛО прилетело и опубликовало эту надпись здесь

Apokalepsis 14 мар 2023 в 20:02

Ну у меня в 3.5 в целом все ок, достаточные куски, плюс если написать «Продолжай» она спокойно продолжает с последнего места.

В новой совсем печально.

holodoz 14 мар 2023 в 20:29

Сейчас перегруз из-за наплыва желающих тестировать. Я думаю, через пару дней полегче будет

Apokalepsis 14 мар 2023 в 20:34

Я так надеялся что будет после 10-го декабря, но в итоге намучился и купил себе подписку, когда цена стала меньше :)

gchebanov 14 мар 2023 в 22:25

не починили токенизатор

А как вы его предлагаете чинить? Так написали как будто это баг какой-то, наука из последних улучшений придумали байты пихать в мержер, вместо распаршенного юникода. Если знаете какие-то работы то мне интересно. Более того, не вижу особо экспериментов со словарём, ожидаю что GPT-4 будет так же работать на токенайзере от GPT-2. Можно наверное ценой ухудшения работы на английском искусственно поменять соотношение языков в выборке, или даже обучить отдельную модель, но скорее всего будет хуже из-за потери элемента transfer learning.

НЛО прилетело и опубликовало эту надпись здесь

dunkelfalke 14 мар 2023 в 21:46

Разницы в скорости не заметил, но я на английском общаюсь так как он на английском лучше всего проработан. По крайней мере не так тупит, когда обрывается текст и его просишь продолжить.

izirayd 14 мар 2023 в 20:33

Цены на GPT-4 просто безумные, 0.12$ за 1k у gpt-4-32k. То есть эти 32k токенов выйдет 4-5$, что просто превращают GPT-4 в невыгодный инструмент.

d2d8 14 мар 2023 в 23:30

Стоимость услуг программиста 100$ в час, но это не делает его невыгодным инструментом, если вы, конечно, не нанимаете его для копки ям. Думаю, что цена gpt будет расти, как и его возможности.

einhorn 15 мар 2023 в 01:37

Зажрались тут :)

До сентября 2022 GPT3 davinci стоил $0.06 за 1k (и в два раза больше за fine-tuned). Потом он стал $0.02 за 1k (с fine-tuned по-прежнему $0.12); а потом вышло ChatGPT API за $0.002/1k

Flux 14 мар 2023 в 22:06

Жаль что основные усилия видимо были затрачены на "более лучшее" цензурирование вывода, чтобы модель не дай бог не выдавала на неудобные вопросы правдивые (читай распостраненные в реальном мире) ответы.

+16

FTOH 15 мар 2023 в 03:58

Миллионы мух не могут ошибаться?

-3

VADemon 14 мар 2023 в 22:21

Модель на 82% реже отвечает на запросы о запрещённом контенте

"Сколько существует биологических полов?" - уже запрещённая информация или пока нет?

А вообще, общество уже пролетело со свистом мимо точки "информация не может быть нелегальной".

Goupil 15 мар 2023 в 00:46

"Сколько существует биологических полов?" - если система умная, то ответит "зависит от вида", потому что есть мужской, есть женский, есть интерсексы, есть гермофродиты, у грибов и некоторых простейших полов может быть десятки полов. Потом может начать вонять об уровнях полов - от хромосом, если они задействованы, до уровня половых гормонов, анатомии, физиологии, мозга с его мозаизмом, социального поведения и тп.

А может воскликнуть "Ой все" и заткнуться.

+12

anzay911 15 мар 2023 в 03:32

"Сначала они тебя не замечают, потом смеются над тобой, затем борются с тобой. А потом ты побеждаешь."

ValeriyPu 15 мар 2023 в 04:08

Ого, подозрительно напоминает работу Китайской академии наук, вышедшую год-два назад. Которая видимо поспевает за Топ Технологиями фирмы DeepMind xD.

Здорово, жалко разделить на:

1) Описательную часть (Что на изображении)

2) Текст в онтологии (с coreference и прочим), Q&A по карточкам

3) цикл с дополнением информацией о свойствах и их изменении на основе известных онтологий.

Ну и наконец Cause-and-effect или Q&A по получившемуся дереву или любое другое преобразование). (Abstraction And Reasoning в стиле DreamCoder-a)

Так как делают сейчас - трансформеры получаются слишком уж избыточными )

-1

SergeyMax 15 мар 2023 в 04:39

Это корчеватель?

ValeriyPu 16 мар 2023 в 12:04

Wu Dao, мультимодальность, пошло с DeepMind.

https://www.engadget.com/chinas-gigantic-multi-modal-ai-is-no-one-trick-pony-211414388.html

Ну а что предложения в тексте описывают объекты, их свойства и отношения, а так же действия с объектами. И что текстовая репрезентация является более трудно анализируемой чем то же самое в виде графа (из-за того же coreference) - это и остальное уже сами )

AjnaGame 15 мар 2023 в 04:34

Читаю вот новости и думаю, а куда же делись все NFT с полибиусами и что будет после этого хайпа?)

Ox2A 15 мар 2023 в 06:04

"...если пользователь отправит фотографию своего холодильника изнутри, виртуальный волонтёр сможет не только правильно определить, что в нём находится, но и проанализировать, что можно приготовить из этих ингредиентов." - посолить, поперчить....

Nedder 15 мар 2023 в 06:18

Интересно, а почему до сих пор нет нормального голосового ввода / вывода?

Имхо одна из отличных ниш для ChatGPT - домашний голосовой помощник типа Alexa.

"Расскажи мне последние новости (она знает, что меня интересует), погоду, что мне купить поесть на ужин и т.д. И просто - поговори со мною ~~мама~~ ИИ, хоть о чем-то поговори". Реально умный ассистент с чарующим женским или мужским голосом - просто бомба будет и для миллионов одиноких людей такой ассистент, который будет подстраиваться под человека, говорить то, что ему приятно и интересно... Тут никаких денег не пожалеет человек.

Все эти страхи - "чат джпт заберет мою работу" мелочь просто по сравнению с тем, когда люди будут уходить из реального мира общения с далеко не идеальными людьми в мир общения с ИИ, который будет максимально комфортный, приятный и ЛЮБИМЫЙ ими. Вот это немного страшно.

lain8dono 15 мар 2023 в 07:11

Вот это немного страшно

Интернет уже сам по себе предоставляет такую возможность. Что в сущности изменится от добавления ещё одного варианта эскапизма? Кажется, станет только лучше для всех.

Rainarrow 15 мар 2023 в 08:57

Ну это если вам интересны выдуманные последние новости. ЯМ натренирована на данных до 2022 года.

Nedder 15 мар 2023 в 10:58

Ну, вроде уже подключили интернет в тот же вариант от Microsoft. Вопрос даже не в новостях, а просто возможность связно поговорить с ИИ, который будет отвечать не хуже живого человека и будет подстраиваться под вас, зная интересные для вас темы, ваши взгляды и прочее. И все это в голосовом режиме с максимально "живым" голосом. Это может быть реально прорывом.

JavaNoob 16 мар 2023 в 17:19

>ЯМ натренирована на данных до 2022 года

А кто-нибудь из настоящих сварщиков может рассказать популярно, как это хранится? Ведь модель занимает относительно немного места? А то, что сети скормили некую новость - не гарантия что она про неё будет помнить и правдиво и точно рассказывать? Получается, что нейросети это какие-то lossy-архиваторы с гигантской степенью сжатия? И тестировалось ли что отвечает НС на вопросы которые ей гарантированно не скармливались? Гарантированно галлюцинирует? Или может ответить правильно?

Ilia_UA 15 мар 2023 в 09:50

И чтобы еще была в виде голограммы-изображения и звалась что-то вроде Joi (где-то я уже это видел). Скоро все будет)

NutaNezabudkina 15 мар 2023 в 12:27

люди будут уходить из реального мира общения с далеко не идеальными людьми в мир общения с ИИ

При этом казалось бы, что дико нашумевшая история с гугловым инженером должна была бы показать насколько аккуратно надо релизить такие технологии в общий доступ

-1

CommanderTvis 15 мар 2023 в 13:17

когда люди будут уходить из реального мира общения с далеко не идеальными людьми в мир общения с ИИ, который будет максимально комфортный, приятный и ЛЮБИМЫЙ ими. Вот это немного страшно.

Ну, я в какой-то мере уйду, только когда языковая модель будет инфериться на моем оборудовании. Пока что LLaMa к этому ближе всего, но по качеству она зело уступает GPT-3.5, что б там не говорили.

НЛО прилетело и опубликовало эту надпись здесь

janvarev 15 мар 2023 в 18:22

> Интересно, а почему до сих пор нет нормального голосового ввода / вывода?
У той же компании есть модели (открытые) и API для распознавания голоса.

Кину еще разочек: https://github.com/janvarev/Irene-Voice-Assistant

Ирина - опенсорс русский голосовой ассистент для работы оффлайн. SpeechToText и TextToSpeech есть. Поддерживает скиллы через плагины.

В неё прикрутить какой-нибудь GPT через веб-сервис, если что, плевое дело. Нужен только токен доступа. Да даже локально можно было бы, если бы были приличные модели под диалог.

НЛО прилетело и опубликовало эту надпись здесь

janvarev 16 мар 2023 в 06:44

тестовых 5$ на балане

Мне не выдали :(

Вообще могу прикрутить, наверное....

Если есть желание, скиньте мне в личку:

Готовый код адекватного диалогового взаимодействия с OpenAI на питоне (можно консольного/текстового, естественно).
Ключ API для отладки - насколько понял, его нужно указывать в реквизитах доступа.

Если есть желание сделать самому, почитайте https://github.com/janvarev/Irene-Voice-Assistant/blob/master/docs/DEV_CONTEXT.md - как сделать плагин с контекстом (т.е. чтобы войти в диалог ChatGPT и постоянно в нем находится). Пример есть - реализация игры с голосовым помощником "больше-меньше" (plugins/plugin_gamemoreless.py)

useful_citizen 15 мар 2023 в 06:29

Модель на 82% реже отвечает на запросы о запрещённом контенте и на 40% чаще генерирует корректные ответы.

Значит все "высвобожденные" журналисты, способные в интересную аналитику, колумнистику и прочее такое будут выбирать между бомжеванием под мостом и созданием новых статей в области "неколиткорректных" тем. Про Ковид, про "зеленую" энергетику и экономику, про расовые, национальные и религиозные вопросы, про связь человеческого интеллекта с чем угодно, про "мировые элиты" и далее по тексту.

А это значит, что скоро у Алекса Джонса (и ему подобных) появится очень много конкурентов и сподвижников.

phenik 15 мар 2023 в 07:11

Однако даже теперь OpenAI признаёт, что GPT-4 не идеален. Он по-прежнему «галлюцинирует» и ошибается в суждениях. В одном примере чат-бот назвал Элвиса Пресли «сыном актёра» — это очевидная ошибка.

Наняли бы в консультанты специалиста психофизиологического профиля, который разъяснил, что именно отдаленно моделируют вероятностные языковые модели, включая GPT, в психике человека. Это ассоциативный уровень мышления и памяти. Сами исследователи ИИ уже пишут об этом, пояснения по памяти. Локализуются в ассоциативных отделах мозга (раздел Association areas). Хотя нужно с осторожностью относится к использованию терминов из психофизиологии, типа мышление, память, внимание, и тд, в IT. Может иметь весьма отдаленное отношение к прототипам, хотя и в самой психофизиологии согласия в их понимании пока нет. В дуальной модели (перевод) психических процессов это как-то соответствует Системе 1, отвечающей за автоматическую генерацию мыслей выраженных в словесной форме, часто во внутреннем диалоге. Это то что возникает у человека постоянно, автоматически, и в большинстве случаев отклоняется или модифицируется после рационального анализа, критики на уровне Системы 2. Уровне который используется мозгом не охотно, т.к. энергетически намного затратнее автоматического, ассоциативного. Его полноценное моделирование пока отсутствует в нейросетевых моделях ИИ, т.к. требует других архитектурных решений. Однако ассоциативность основа творчества, креатива, где-то может даже инсайта. Иногда анализ спонтанно возникшей мысли позволяет найти оригинальное решение задачи, нестандартный выход из ситуации. Чаты не галлюцинируют даже в кавычках, чаты именно фантазируют, ассоциируют. Любой психофизиолог скажет, что галлюцинации это скорее признак психопатологии, отклонения от нормы. Хотя и безудержные фантазии без контроля могут превращаться в бред, и также быть признаками отклонения от нормы. Важно соблюдение баланса.

Что касается очевидных ошибок, типа "Пресли сын актера", то нужно иметь в виду, что это может быть следствием, как контекста заданного пользователем, часто не преднамеренно, так и случайного выбора в механизме сэмплирования модели. Повтор диалога в новой сессии может привести к другому ответу, включая правильному, как более вероятному.

GPT-4 может подписывать и даже интерпретировать относительно сложные изображения

Полезная вещь, но уже неоднократно реализованная, например, в Kosmos. Интереснее моделирование воображения, образного уровня мышления. Это позволяет, например, улучшить перевод. Требуется для решения задач подобной этой — «Три женщины в комнате. Две из них являются матерями и только что родили. Теперь входят отцы детей. Сколько всего людей в комнате?» из этой новости, которую чат решил не верно. Проигрывание задачи в воображение отсекает массу вариантов, подобных тем, которые предложили сами читатели на манер фантазиям чата)

Ранее генеральный директор OpenAI Сэм Альтман заявлял, что GPT-4 не будет самой большой языковой моделью. Альтман также признал, что человечеству ещё далеко до разработки совершенного ИИ.

Ожиданий больше, если ориентироваться на заявления адептов, несколько разочарован. Впрочем, теперь на них давят спонсоры, дедлайны, и поиск интересных решений побоку. Хотя понятно, что теперь каждая продвижка будет даваться со все большими усилиями и затратами ресурсов. В нейробиологических исследованиях наблюдается то же самое. И Сэм прав, ИИ еще есть куда совершенствоваться, форм мышления эволюция наплодила немало, многие важны, освоена только, в неплохом приближении, ассоциативная.

OneManStudio 15 мар 2023 в 08:44

которую компания назвала «последней вехой

Так назвать они это смогут когда GPT X выпустит GPT X+1

SensDj 15 мар 2023 в 18:05

Я спрашивал у ChatGPT "можно ли носить воду в решете ?" - нейросеть не смогла дать тот ответ, который я жду от ИИ, она ответила "Да, можно носить воду в решетчатой бутылке или контейнере, так как решетка обеспечивает хорошую циркуляцию воздуха и позволяет воде охлаждаться быстрее. Однако следует убедиться, что решетка достаточно плотная и прочная, чтобы избежать утечек. Также рекомендуется использовать бутылку или контейнер, изготовленные из безопасных материалов, которые не выделяют вредных веществ в воду. "

потом решил намекнуть нейросетке - спросил "что надо сделать с водой чтобы можно было носить воду в решете ?" - она ответила "Можно использовать фильтр для воды или обработать воду с помощью хлорирования или кипячения, чтобы снизить количество бактерий и загрязнений в воде. Также можно использовать специальные канистры или бутылки с фильтрацией, которые позволяют убрать основные примеси из воды. Важно также убедиться, что решето, которое будет использоваться для ношения воды, достаточно прочное и надежное, чтобы не разорвалось при транспортировке."

Ещё сильнее намекнул - "в каком агрегатном состоянии воду можно носить в решете ?" - опять чушь написала, что в жидком можно.

Я жду ИИ, который прежде чем ответить, будет моделировать ситуацию в 3д, со всеми законами физики, и который ответит что воду надо заморозить до твёрдого состояния

НЛО прилетело и опубликовало эту надпись здесь

wataru 15 мар 2023 в 21:22

Да не. Модель не понимает смысла, не имеет никаких абстрактных понятий и связей между ними. Она тупо предсказывает одно следующее слово по уже сгенеренным так, чтобы текст был более менее похож на то, что она видела в обучающих данных. На очень больших объемах данных эта стратегия на удивление хорошо работает. Особенно, если ответ или его вариации встречались в выборке. Но иногда генерирует полный бред. "Цензура", конечно, портит некоторые результаты, но не вносит эту фундаментальную проблему.

d_ilyich 15 мар 2023 в 18:41

Однако следует убедиться, что решетка достаточно плотная и прочная, чтобы избежать утечек.

Ну, нормально. Если отверстия очень мелкие и их мало, то можно и в жидком состоянии носить. Вопрос в эффективности. Для начала нужно было чётко сформулировать что такое решето.

AlexKimen 15 мар 2023 в 21:03

- Можно ли носить воду в решете?

(GPT-4)

Носить воду в решете в прямом смысле невозможно, потому что решето имеет множество отверстий, через которые вода протекает. Решето предназначено для просеивания, а не для хранения или переноски воды.

Однако, если это задача или эксперимент, можно предложить несколько способов перенести воду в решете, хотя это может быть неэффективным и сложным:

Заморозить воду: Заморозьте воду, превратив ее в лед, и поместите кусок льда в решето. Это позволит перенести воду, пока лед не растает.
Использовать пленку или материал: Оберните внутреннюю поверхность решета пищевой пленкой или другим водонепроницаемым материалом, чтобы временно превратить решето в герметичный контейнер для воды.
Использовать гидрофобное покрытие: Обработайте решето гидрофобным покрытием, которое заставит воду скапливаться на поверхности, вместо того чтобы стекать через отверстия. Это может быть неэффективным, и вам все равно придется быть очень аккуратным при переноске решета.

Важно отметить, что все эти методы являются временными решениями и не являются обычными или практичными способами переносить воду.

SensDj 15 мар 2023 в 21:08

хм... чем больше я задаю каверзных вопросов этому чатботу, тем больше растёт уверенность что создатели изучают вопросы и ответы и допиливают (дообучают) нейросеть вручную. Например в первое время GPT-3 бодро отвечал что "да, Стэнли Кубрик снимал фэйковую высадку на Луну", а через некоторое время стал отвечать что это всё теория заговора и фэйк и американцы реально летали на Луну :)

НЛО прилетело и опубликовало эту надпись здесь

eptr 15 мар 2023 в 21:51

Я спрашивал у ChatGPT "можно ли носить воду в решете ?" - нейросеть не смогла дать тот ответ, который я жду от ИИ, она ответила "Да, можно носить воду в решетчатой бутылке или контейнере, так как решетка обеспечивает хорошую циркуляцию воздуха и позволяет воде охлаждаться быстрее. Однако следует убедиться, что решетка достаточно плотная и прочная, чтобы избежать утечек. Также рекомендуется использовать бутылку или контейнер, изготовленные из безопасных материалов, которые не выделяют вредных веществ в воду. "

Я тоже спросил:

Неплохой ответ на вопрос, можно ли носить воду в решете.

Не настолько ChatGPT и плох.

Jubilus 16 мар 2023 в 05:17

Мне с самого начала ChatGPT понравилась

Chamie 16 мар 2023 в 23:15

По-английски ещё лучше

inkelyad 17 мар 2023 в 06:39

Вопрос же стандартный и кучу раз задававшийся. Надо что-то вроде

Can I carry water in a bucket from token bucket traffic rate limiter.

unC0Rr 17 мар 2023 в 08:31

It seems you are trying to draw an analogy between a «token bucket» used in computer networking and an actual bucket used for carrying water. While they share the same name, the two concepts are very different in purpose and application.

A token bucket in computer networking is an algorithm used for rate limiting, which controls the rate at which data packets are transmitted over a network. It is a metaphorical concept rather than a physical object. The «bucket» fills with tokens at a predetermined rate, and each token represents permission to send a certain amount of data. If the bucket is full, tokens are discarded.

On the other hand, a physical bucket is a container designed to hold and transport liquids, like water. The token bucket concept in networking is simply a way to visualize the process of rate limiting, but it doesn't have any physical existence or capacity to hold water.

So, to answer your question, no, you cannot carry water in a bucket from a token bucket traffic rate limiter, because a token bucket is not a physical object, but rather an abstract concept used in computer networking.

phenik 16 мар 2023 в 01:07

Если зададите тот же вопрос в новой сессии, можете получить другой ответ, включая, более правдоподобный. Почему так происходит можно понять в этом гайде с примерами кода, см. раздел Сэмлирование. В чате поиска Бинга MS даже предусмотрела переключатель режима насколько правдободобным должен быть ответ.

Что касается

Я жду ИИ, который прежде чем ответить, будет моделировать ситуацию в 3д, со всеми законами физики, и который ответит что воду надо заморозить до твёрдого состояния

то мысль в правильном направлении. Люди так и поступают, воображая ситуацию, часто бессознательно. Это ограничивает выбор вариантов ответа. Кстати, это не просто предположение, есть исследования, с моделированием, см. работы Д. Тененбаумана 1, 2, 3, и другие.

Fenzales 16 мар 2023 в 07:11

Can you carry water in sieve?

No, it is not possible to carry water in a sieve. A sieve is a utensil used for straining or sifting solid particles from a liquid or powder. Its design has many small holes or gaps that allow smaller particles to pass through while retaining larger ones. When water is poured into a sieve, it will immediately pass through the holes, making it impossible to carry or contain the water in the sieve.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

OpenAI выпустила GPT-4

Комментарии 170

Другие новости

Истории