Обновить
660
22.6

Замглавреда

Отправить сообщение

Это я уже её передвинул, поскольку многие не дочитывают до нужного фрагмента.

Извиняюсь, из-за ограничений продолжение в телеграме

Каких ограничений? На Хабре редактор статей больше не принимает тексты длиннее 12 абзацев? Или вы любите писать тексты только в мессенджерах, где нет даже поддержки нумерованных списков?

Вот ваше продолжение:

  1. Альтман оказался живучим. Он вернулся почти тут же. А совет директоров сменили (для конспирологии: как думает, кто за этим стоит?)

  2. Маск почти в этот же момент упрекает OpenAI, что они нарушили условие получения инвестиций от него: они должны были оставаться некоммерческими и работать на весь мир.

  3. В короткий срок друг за другом OpenAI покидают, как побитые, почти все основатели компании (старая команда, великие умы, звезды).

  4. Все почти молчат. Потому что NDA строгий, могут попу напороть и кучи денег лишить. Боятся. Говорят что-то типа: спасибо этому дому, пошел к другому. Мол творческий поиск. Кто-то сделал компании.

  5. OpenAI продолжают свое существование. CEO и CTO успевают вместе после неудавшегося переворота (вернее удавшегося, но с другой стороны) заявить о новых достижениях. И кажется живут душа в душу.

  6. И вот вчера гром среди ясного неба. CTO (Мира Мурати) уходит. Тоже в поиске чего-то и с благодарностью.

Вот из далека оценивая только факты без сплетен, что вы имеете на это сказать?
Конечно же, все выглядит так, что Альтман может праздновать победу, переворот завершен.

Обратите внимание, что команда ушла на пике успеха, несколько увядающего на фоне достижений конкурентов. То есть они ушли вовремя.

Что компанию ждет дальше?
Запас прочности моделей хороший, наверняка и в загашнике припасены, но не показываются новые разработки. Поэтому в ближайшее время, совсем новых бурных открытий ждать не приходится от OpenAI, а вот попытки обернуть имеющиеся в звонкую монету будут весьма громкими. Мне кажется, что в самое ближайшее время компанию ждет коммерческий успех с кучей новых продуктов. А выживет ли дальше - не знаю. Скорее всего да. Они уже слишком большие, чтобы рухнуть 😉

Что принесет это нам?
Ничего особенного. Скорее, что не принесет. Реально существенных исторических достижений от OpenAI нам скорее всего не увидеть. Ну и фиг с ними (я про компанию, а не про открытия).
А продуктов будет много. И кто сейчас эти продукты только не делает.

Ну и мечту о чистом искусственном интеллекте будущего всему человечеству придется оставить.

Первый и единственный оплот надежны на это - компания OpenAI - испачкан руками предприимчивого Альтмана.

А других на горизонте нет.

Теперь к качеству аналитики. Вы меня извините, но такой бестолковый набор мыслей достоин быть комментарием в обсуждении под новостью, а не рекламироваться как причина подписаться на какой-то канал в «Телеграме», где у меня только переписка с родственниками. Зачем вы вместо этого заводите какие-то каналы и их назойливо рекламируете?

Вы перечисляете кучу разных событий, а затем делаете вялые, очевидные и неинтересные выводы. Часть из изречений просто неверна.

Но спустя всего два года стало ясно, что конкуренты легко повторили достижение и во всю начинают клепать сервисы и зарабатывать деньги на хайпе. А что же OpenAI? А им нельзя! Они некоммерческая благотворительная организация. Блин, но очень же хочется.

Весь ваш анализ начался с набора грубых ошибок и демонстрации полного непонимания произошедшего.

  • К благотворительности OpenAI не имеет никакого отношения. Это некоммерческая организация, nonrofit. Если упрощать: если обычная компания существует ради извлечения прибыли для своих владельцев, то некоммерческая организация нацелена что-то делать без обязанности зарабатывать для инвесторов. Все доходы у некоммерческой организации (если таковые находятся) вкладывает в своё дальнейшее развитие. У некоммерческой организации и инвесторов по сути нет — они ей дают пожертвования, а не инвестиции.

  • У OpenAI структура сложная. Есть коммерческая часть, которая имеет право извлекать прибыль. Однако на данный момент она связана по рукам и ногам некоммерческой частью и ей полностью управляется, не говоря уже про всякие механизмы capped profit.

Теперь структуру якобы меняют так, чтобы теперь nonprofit больше мешал зарабатывать деньги, и принцип capped profit тоже исчез.

Мне кажется, что в самое ближайшее время компанию ждет коммерческий успех с кучей новых продуктов.

  • Можно подумать, до этого пользователей у ChatGPT не было, инвесторы отказывались давать деньги, а новых продуктов OpenAI не показывала.

  • «Мне кажется» — это не аналитика. А мне кажется, что компанию не ждёт коммерческий успех. Как моё мнение оспорить?

Обратите внимание, что команда ушла на пике успеха, несколько увядающего на фоне достижений конкурентов. То есть они ушли вовремя.

Люди не уходят просто потому, что сейчас был какой-то пик успеха и дальше будет только хуже. Команда разбежалась по своим собственным причинам.

  1. Внутренние конфликты. Говорят, что Альтман тоже не сахар. Но о деталях рабочих конфликтов ничего не будет известно ещё много лет.

  2. Провалившиеся попытки ухватить контроль над организацией, из-за чего заговорщиков попросту выгнали.

  3. Наличие куда более приятных перспектив. Сейчас инвесторы просто за твоё имя дают миллиард на компанию. Трудно даже вообразить, какими коврижками Anthropic, Meta и Google переманивают обычных сотрудников из OpenAI.

Ваш текст перегружен и тороплив. Многие предложения торопятся уместить две конкурирующие мысли, которые нужно развивать отдельно. Так и здесь:

  • Команда ушла на пике успеха.

  • Конкуренты OpenAI уже наступают на пятки.

Пара похожих примеров, где начинается какая-то шизофрения и где в одном предложении пытаются уместиться две разных мысли:

А совет директоров сменили (для конспирологии: как думает, кто за этим стоит?)

CEO и CTO успевают вместе после неудавшегося переворота (вернее удавшегося, но с другой стороны) заявить о новых достижениях.

Далее:

Запас прочности моделей хороший, наверняка и в загашнике припасены, но не показываются новые разработки. Поэтому в ближайшее время, совсем новых бурных открытий ждать не приходится от OpenAI, а вот попытки обернуть имеющиеся в звонкую монету будут весьма громкими.

Можно подумать, до этого OpenAI не пыталась продавать свои продукты.

Что вы сказать-то хотели? Коммерческая организация будет извлекать прибыль для своих инвесторов с помощью своих активов? Вы это называете аналитикой? Вы ради такого завели отдельный канал в «Телеграме», которым теперь спамите на Хабре?

Ну и фиг с ними (я про компанию, а не про открытия).

Меня это предложение выбешивает по двум причинам:

  • Компания или организация — она одна. OpenAI сделала, открыла, опубликовала и так далее. Компания — это не «они».

  • Зачем вы так пишете, будто это устная речь? Разве нельзя просто написать «ну и фиг с ней с OpenAI»?

В целом выглядит как кривляние. По тексту много похожих ужимок и маневризмов, которые абсолютно все меня крайне раздражают:

В OpenAI происходит смена концепции (как в старом анекдоте)

Они сказали: ВАУ! И весь мир сказал ВАУ!

А совет директоров сменили (для конспирологии: как думает, кто за этим стоит?)

Вот из далека оценивая только факты без сплетен, что вы имеете на это сказать?

Далее:

Реально существенных исторических достижений от OpenAI нам скорее всего не увидеть.

На основании чего вы делаете такие выводы? На самом деле у меня похожее ощущение. Мне просто интересно посмотреть на ваши источники. Проиллюстрируйте, почему вы так считаете. Я это прошу сделать потому, что будущее предсказать крайне тяжело.

Вся архитектура трансформеров и выравнивание моделей в чат-ботов получились практически случайно. Случайно оказалось, что публике крайне интересен чат-бот, который выполняет ролевую игру в услужливый всесильный искусственный интеллект. Случайно это впервые сделали в OpenAI, а не внутри Google, где изобрели трансформеры.

В 2022 году никто не мог предсказать появление ChatGPT. Вместо этого лет десять обещалось, что вот-вот будут готовы робомобили с компьютерным зрением, и поэтому профессия водителя скоро отомрёт. GPT-2 никто всерьёз не воспринимал, эта языковая модель выглядела как забавная игрушка.

Сейчас автопилоты отошли куда-то на второй план, а вместо этого обещают заменить программистов, дизайнеров и техподдержку. Уже два года люди пытаются осознать, что делать с этим рисованием картинок и генерацией текстов.

Очень немногие представляют, каким будет будущее. Увы, вы к числу этих людей не относитесь.

Речь про использование чужих ключей. Насколько я понял текст, там то ли был намеренно установленный ханипот, то ли специалистам компании дали чьи-то логи по украденным ключам.

мы выкладываем только самое полезное, свежее и интересное!

Нет, на вашем канале только поверхностные публикации, выполненные ещё более лениво, чем ваши рекламные посты на Хабре.

К примеру, в новости на Хабре вы обещаете вот такое:

Инструкции по тому, как скачать оттуда модели, воспользоваться ими, или даже зафайнтюнить их под свои задачи, вы сможете найти в нашем тг-канале Data Secrets

Никаких инструкций по скачиванию моделей и их использованию у вас нет. Там просто стоит ссылка на Hugging Face.

Кстати, вот эта ссылка:

Зачем вы прячете ссылку, да ещё и завлекая заведомо ложными обещаниями «а у нас уже есть инструкции, как это файнтюнить»? Меня настолько откровенная ложь глубоко поражает.

Ссылки на остальные три варианта модели вы попросту потеряли. Оставляю их здесь:

Вы в принципе делаете всё максимально торопливо и без любви к теме. Упоминание факта блокирования скачивания из ЕС в посте в канале есть, причины не названы. А ведь ещё в июле Meta предупредила, что выпустит мультимодальные модели, но в Евросоюзе их не будет. Тогда же было сказано, что дело не в каких-то европейских законопроектах регулирования ИИ, а в соблюдении норм старого доброго GDPR.

В этом и есть огромная проблема всех подобных каналов в «Телеграме»: вместо новостных статей со всем контекстом даются заголовки, по которым читатель составляет максимально поверхностное мнение. Полноценная картина мира из такой жвачки не получится.

Думаю, причина в формате. «Телеграм» — в первую очередь мессенджер, то есть чат. У него есть много ограничений: текст с максимально базовым форматированием (нет подсветки кода, к примеру), возможность присоединить до 10 картинок и только в конце, до 4096 символов в сообщении (крайне мало, у меня комменты на Хабре бывают длиннее) и так далее. Формат не стимулирует писать длинные подробные тексты.

Поэтому выглядят странно любые призывы ради дополнительных подробностей подписываться на какой-то канал в «Телеграме». Подробности обычно бывают в книге или полноформатном блоге, а не мессенджере или микроблоге по типу «Твитера».

В отчёте исследования это обходится стороной. Утверждается, что качество не меняется. Вероятно, падение в 5,53 % считается статистически незначительным.

Это данные до начала эксперимента. Чем меньше там разница, тем лучше. Добавил подпись, спасибо.

Это текст про самые простые методы выявления текстов от БЯМ. Писалось в пять предложений в чате для человека, который видел очевиднейшее творение ИИ, но ничего необычного не замечал. Затем объём немного разросся, и вот уже на чтение нужно минут десять. Возможно, кому-то ещё пригодится.

Я не сомневаюсь, что можно обмануть кого угодно, если постараться и подключить продвинутые техники промптинга, у названия которых даже перевода на русский нет. Но мне хотелось помочь выявить хотя бы самых ленивых копипастеров ChatGPT.

Кнопка превращения Хабра во что угодно находится в правом верхнем углу рядом с вашей аватаркой и носит название «Написать публикацию». Только написанием публикаций возможно определить облик Хабра.

Невозможно заставить остальных авторов что-то не делать. Внештатных модераторов Хабр, увы, не набирает. Эталона тематики тоже не завезли. У хабов есть только коротенькие текстовые описания, диапазон толкования которых широк. Поэтому бесплодны и бессмысленны все вот эти обсуждения уровня «сгиньте, вам на Хабре не место». Спорьте за тематику с модераторами, а не травите авторов — так хотя бы вероятность добиться желаемого выше.

На Хабре с самых первых дней были публикации на отвлечённые тематики. Дальнейшее развитие легко отследить по событиям. Производились попытки отделить от Хабра научпоп и развлекаловку, а позже — бизнес и менеджмент. Затеяли это всё десяток лет назад, но потом вернули обратно. Противники и критики были у каждой стадии отделения и слияния. Кто-то просил убрать часть хабов, кто-то требовал непременно вернуть офтоп на место.

Наконец, на Хабре читатель может вручную персонализировать ленту публикаций. Если вам так не нравится бизнес, лично я на вашем месте читал бы только выбранные хабы и попросил бы автора убрать хаб «Лайфхаки для гиков» у статьи. Остальные хабы касаются потока «Менеджмент».

Меня вообще озадачивает эта претензия про тематику. Никто не пользуется настраиваемой лентой, что ли? Почти никогда не вижу вопросов о выборе хабов у публикации — только требование не писать вообще.

Почему арестовали? Есть гораздо более простое и понятное объяснение.

Но я периодически делюсь подобными техническими тонкостями в коротких постах на своём Telegram-канале, поскольку формат Habr не всегда подходит для этого.

На Хабре уже больше года как заведён раздел «Посты», который буквально для таких коротких (до 1500 символов) публикаций и предназначен.

А в «Телеграме» у меня чат с мамой. С моей точки зрения, «Телеграм» для чтения и ведения блогов абсолютно не предназначен. Публикация в «Телеграме» выглядит как сообщение, нет возможности чередовать текст и изображения, есть куча разных ограничений, отсутствует РСС.

Зачем заводить и вести айтишные блоги в мессенджере, который ещё непонятно как индексируется поисковиками — загадка. С таким же успехом можно пытаться делиться опытом в «Снэпчате» или просить подписаться на аккаунт в «ТикТоке». Для меня каналы в «Телеграме» выглядят как очередное коллективное помешательство.

Например, одна кукла была феей с хрустальными крыльями.

Странно, мне казалось, что у Тируно крылья из кристаллов льда. Выглядит симпатично, разве что обычно на официальных артах и в косплее она босая.

Рейму тоже выглядит хорошо. Лично меня смущают чулки, которых в оригинале дизайнов не встречалось. Полагаю, тоже пожелание заказчика.

Переводчик-то тут при чём? Это вопрос автору оригинала:

It is well known that the sed and awk commands are Turing complete on their own

У меня нет никаких иллюзий, какой вывод будет у исследования биржи фриланса. Просто там это уж как-то совсем внаглую сделано, переход слишком откровенный — даже транслировать не хочется.

Это технически крайне тяжело. Детекторы существуют, но могут ошибаться. И вообще нужно правильно толковать их работу. К примеру, текст конституции США будет определён как результат генерации большой языковой модели по той простой причине, что БЯМ легко может процитировать этот документ.

Часто пытаются смотреть на ключевые слова и обороты, характерные для той или иной модели, структуру (некоторые БЯМ обожают разбивать всё на пункты) и общую грамматическую корректность текста.

Так они же фрилансеры?

Данных по фрилансерам из исследования я просто не приводил вообще. У «Апуорка» там какая-то забавная манипуляция вида «фрилансеры лучше штатников справляются с ИИ», которую мне транслировать кажется неинтересным и нечестным. Поэтому в новости есть результаты опросов только штатных работников и руководителей. В общем-то, не представляю, почему вы решили, что речь идёт по фрилансерах.

А вы что собирались увидеть-то? «Не понравилось, как выглядит и как влияет не производительность» размещено ещё до ката. Весь остальной объём посвящён объяснению, о чём эта фича вообще была. У меня ощущение, что вам (в отличие от меня) эта тема попросту глубоко неинтересна.

Языковая модель не знает, как она работает. Попробуйте ещё у неё спросить, как она отвечает на промпт. Начнётся полный бред «я планирую в несколько стадий, улучшаю, а только потом даю ответ», а не правильное «ничего не планирую, просто пытаюсь предсказать следующий токен по ходу генерации».

В данном случае модель расписывает понимание, как статистически наиболее вероятно понимался глагол «галлюцинировать». При этом модель несёт откровенный бред. Просто попробуйте вчитаться:

  • Сначала идёт утверждение, что БЯМ — это ИИ, поэтому галлюцинировать не может вовсе.

  • Затем модель обещает стараться не галлюцинировать. Странно. Зачем стараться избегать какого-то поведения, если физически на него не способен?

  • Под конец идёт попытка объяснить, почему галлюцинации возможны, и ещё одно обещание избегать галлюцинации.

    Кстати, здесь модель фактически признаёт, что галлюцинации неизбежны. Достаточно прочитать текст и задуматься о сказанном.

    • БЯМ говорит, что будет осторожнее с hypothetical statements. Ответы на подавляющее число вопросов выглядят как гипотетические утверждения. Что говорить о будущем, даже исторические исследования — это спекуляции и противоречивые источники.

    • Substantiate — это «to establish by proof or competent evidence», если верить Dictionary.com. Модель обещает быть осторожнее с заявлениями, которые можно охарактеризовать как unsubstantiated. Без интеграции с приложениями БЯМ физически не могут давать гиперссылки на источники, то есть «proof or competent evidence» невозможен.

Получается, что БЯМ противоречит сама себе — то есть уже галлюцинирует в 4 абзацах текста. Текст звучит хорошо, усыпляет ответственную за скептицизм часть мозга, поэтому вы в него не вчитывались и скопипастили мне его как доказательство.

Не надо, пожалуйста, копипастить мне (или куда угодно ещё) какие-то непонятные куски вывода ChatGPT как доказательство чего-либо. Языковая модель — не источник абсолютно никакой информации. Складно выглядящий текст не всегда является правильным.

Поражаться тут нечему. Сделано местами наивно.

  • «Не галлюцинируй» — это вишенка на торте. Ничего хорошего такое не даст. Чёткого определения галлюцинаций БЯМ до недавних пор не было, в датасетах это представлено плохо. Сами модели не понимают, что они делают и себя не осознают. Такое мог написать впервые знакомящийся с технологией разработчик, который про галлюцинации где-то услышал.

    Галлюцинации от системного промпта зависят слабо. Невозможно их вот так просто отменить.

    В целом в промпте важно не только то, что сказано, но и то, что не сказано. У меня сложилось ощущение, что лучше не просить «не сделать», а подобрать глагол без «не». Пример: «не переводи текст на уровне подстрочника» → «перевод должен звучать естественно, правильно передавай стиль оригинала». И вообще общаться с БЯМ лучше лаконично, аккуратно отмеряя каждое слово.

    Возможно, что из-за присутствия глагола «галлюцинировать» случится обратный эффект, и модель будет чуточку чаще галлюцинировать.

  • «Выдавай правильный JSON». Иногда JSON будет ломаться. Даже если давать на входе абсолютные требования «всегда делай вот это», БЯМ могут в крайне редких случаях «вот это» и не сделать. И личный опыт утверждает, что чем больше этих абсолютных требований, тем выше вероятность, что одно из них будет случайно нарушено.

    Странно, что не используется function calling самой OpenAI.

  • Прочие мелочи типа слова «пожалуйста» или восклицательного знака в «Ты режиссёр на съёмках кино!». Особая вежливость для БЯМ не требуется, их выравнивание уже задало им нужную роль, поэтому please — это впустую потраченный токен. Второй пример может увенчаться восклицательным знаком в первом предложении ответа или более возбуждённым стилем.

В целом написано типичным стилем «Ты %роль%, ты делаешь %задача%». То есть в общих чертах с соответствующей страницей поддержки OpenAI автор этих промптов был знаком, наверное. Но дальше начинаются эти странные детали.

Информация

В рейтинге
Не участвует
Откуда
Екатеринбург, Свердловская обл., Россия
Зарегистрирован
Активность