Помню в какой-то момент попросил нейронку китайскую написать топ 10 смешных шуток по теме общения. Тот отказался, т.к. сказал, что кто-то может обидеться. И всё, ушла в незабытие. Со следующим обновлением и шутила и что только не делала, взлетела по популярности. Фильтры важны, но главное не перегибать.
Что сказать. Реалистичность и согласованность в генерациях действительно запредельная. В прошлый год Deepseek всколыхнул западное ИИ сообщество. Сейчас Seedance 2 (от ByteDance, который владеет TikTok)
Я всеми руками за то, чтобы ИИ при заходе на сайт, заявлял о себе и использовал инструменты, которые не использует человек. Это должно быть базой, иначе отличить человека от робота станет невозможно и всю рекламу будут смотреть и скликивать роботы, набивать просмотры и посещения. Хоть я и не сторонник рекламы, но она двигатель экономики.
4o ценили и ругали за подхалимство. Насколько понимаю, это всё можно выбрать в самом интерфейсе в настройках. OpenAI просто могли сделать рекламный трюк - создать специальную птичку "Эмпатия (системный промпт 4o)" и всё, было бы 4o, но на новом движке. Но как всегда за это отвечают люди, плодящие 100+ версий микро-мини-нано и вставляющие рекламу в чат. Это похоже на то, как загибались винампы и прочие архивные топы.
Результат Codeforce впечатляет. Уже на уровне лучшей десятки программистов (в районе 7 места в таблице). Если так, то это серьёзное обновление. Будет на чём дистиллировать свои ИИ некоторым компаниям.
Все говорили про год агентов. И знаете что? Походу были правы. Если бы китайские компании не стали конкурировать с американскими, до сих пор бы был 4o топовым. Хотя мне интереснее смотреть как продвигаются графические и видео нейросети. Миджорни уже вообще не стараются удержаться.
Просто не попали в золотую середину. Кому то надо чуть проще, кому-то чуть сложнее. А процесс рассуждения - это генерация текста уже после внутреннего рассуждения, так сейчас новые ИИ работают. При желании может умолчать о чём думал.
Думает долго, пишет чётко. В чате не разгуляешься, поэтому проще просить писать что на что поменять в коде, а ответ отправлять в IDE с бесплатным Kimi k2.5 к примеру или самому менять, но так дольше. Возможно Opus 4.6 подвинется. Для мелких скриптов удобно, для крупных проектов всё ещё рискованно.
Исследователи провели исследование и нашли 950 узкоспециализированных вопросов, в которых ИИ галлюцинируют. Как по мне, просто создали очередной бенчмарк.
Да в целом любой продукт должен решать и закрывать какую-либо потребность. И лучше делать что-то с припиской "Вы не сможете повторить наш продукт, используя нейросети".
Рано ещё под вайбкодинг отдавать целые проекты. Пока ИИ не может сам запускать и видеть, что происходит, это рискованно. А вот давать ИИ безобидные задачи - это можно. Например, попросить провести полное комментирование кода, не трогая функционал и что-то спрашивать по коду. С этим справляется. Простые коды тоже порой пишет неплохо (тот же простой скрипт снежинок для сайта). А всё что более 1000 строк кода - уже тяжело идёт. Программист не исчезнет, но программист "на велосипеде" может двигаться быстрее. Главное, чтобы велосипед был с тормозами и сохранениями.
OpenAI: "Ты нам подходишь"
Помню в какой-то момент попросил нейронку китайскую написать топ 10 смешных шуток по теме общения. Тот отказался, т.к. сказал, что кто-то может обидеться. И всё, ушла в незабытие. Со следующим обновлением и шутила и что только не делала, взлетела по популярности. Фильтры важны, но главное не перегибать.
Когда ИИ галлюцинирует лучше, чем ваш отдел аналитики после дедлайна.
Что сказать. Реалистичность и согласованность в генерациях действительно запредельная. В прошлый год Deepseek всколыхнул западное ИИ сообщество. Сейчас Seedance 2 (от ByteDance, который владеет TikTok)
Я всеми руками за то, чтобы ИИ при заходе на сайт, заявлял о себе и использовал инструменты, которые не использует человек. Это должно быть базой, иначе отличить человека от робота станет невозможно и всю рекламу будут смотреть и скликивать роботы, набивать просмотры и посещения. Хоть я и не сторонник рекламы, но она двигатель экономики.
4o ценили и ругали за подхалимство. Насколько понимаю, это всё можно выбрать в самом интерфейсе в настройках. OpenAI просто могли сделать рекламный трюк - создать специальную птичку "Эмпатия (системный промпт 4o)" и всё, было бы 4o, но на новом движке. Но как всегда за это отвечают люди, плодящие 100+ версий микро-мини-нано и вставляющие рекламу в чат. Это похоже на то, как загибались винампы и прочие архивные топы.
Результат Codeforce впечатляет. Уже на уровне лучшей десятки программистов (в районе 7 места в таблице). Если так, то это серьёзное обновление. Будет на чём дистиллировать свои ИИ некоторым компаниям.
«Мы можем отчитаться за каждый токен в нашей обучающей выборке, кроме первого триллиона, полученного через API конкурентов»
Все говорили про год агентов. И знаете что? Походу были правы. Если бы китайские компании не стали конкурировать с американскими, до сих пор бы был 4o топовым. Хотя мне интереснее смотреть как продвигаются графические и видео нейросети. Миджорни уже вообще не стараются удержаться.
Микро, мини, нано, про, про мини и прочих вариаций им стало мало. Пришёл spark
Просто не попали в золотую середину. Кому то надо чуть проще, кому-то чуть сложнее. А процесс рассуждения - это генерация текста уже после внутреннего рассуждения, так сейчас новые ИИ работают. При желании может умолчать о чём думал.
Они бы провели тест, ради интереса. После поста написать "у нас есть реклама по этому поводу, хотите посмотреть?"
Думает долго, пишет чётко. В чате не разгуляешься, поэтому проще просить писать что на что поменять в коде, а ответ отправлять в IDE с бесплатным Kimi k2.5 к примеру или самому менять, но так дольше. Возможно Opus 4.6 подвинется. Для мелких скриптов удобно, для крупных проектов всё ещё рискованно.
Первой бессмертной на Земле будет лабораторная крыса.
Пошёл бэкапить комп на внешний hdd
Исследователи провели исследование и нашли 950 узкоспециализированных вопросов, в которых ИИ галлюцинируют. Как по мне, просто создали очередной бенчмарк.
Да в целом любой продукт должен решать и закрывать какую-либо потребность. И лучше делать что-то с припиской "Вы не сможете повторить наш продукт, используя нейросети".
Рано ещё под вайбкодинг отдавать целые проекты. Пока ИИ не может сам запускать и видеть, что происходит, это рискованно. А вот давать ИИ безобидные задачи - это можно. Например, попросить провести полное комментирование кода, не трогая функционал и что-то спрашивать по коду. С этим справляется. Простые коды тоже порой пишет неплохо (тот же простой скрипт снежинок для сайта). А всё что более 1000 строк кода - уже тяжело идёт. Программист не исчезнет, но программист "на велосипеде" может двигаться быстрее. Главное, чтобы велосипед был с тормозами и сохранениями.
Они сильно рискуют словить волну хейта. Сгладить углы поможет бесплатный доступ к ИИ, превосходящий конкурентов.
Этот агент - двойной агент. Все обязаны, значат все в итоговой статистике по производительности.