Обновить

Комментарии 24

Да, это уже сделали Blackrock и SakanaAI.

И, да, кроме обезьян из DeepMind (увы, они 3 года запускали нейросети, да. А Илья (якобы) - создатель AlexNet) в одном США с тысячу Иванов из Microsoft.

Планируете ли писать о них? (Что делают, как живут?)

ответы GPT-5.1 он считает слишком многословными, в кто время как Gemini 3 Pro более собранна, а Claude — чрезмерно лаконичен

Решается индивидуальным для каждой llm промптом на сессию, подобранным для выравнивания таких особенностей.

Только надо ли?

совет почти всегда ставит GPT-5.1 на первое место как самую "глубокую и полезную" модель

Я тоже GPT 5.1 high использую.

Модель от Гугл часто уплывает, додумывает, меняет границы задачи, "улучшает" и просто врёт. Поддакивает без добавления своих мыслей. Несмотря на высокие рейтинги я не смог им пользоваться.

Клаудэ периодически впадает в деменцию.

Модель Маска просто болтун

Вот кстати есть ощущение что GPT и Gemini выбираются чисто субъективно. У меня лично опыт с GPT почти всегда: "Много сказано, а задача до сих пор не выполнена", а с Gemini в свою очередь: "Мало сказано, но задача выполнена".

Но это все не 100% и разные задачи разные LLM выполняют с разной степенью успешности. GPT например давно не проверял, но по крайней мере был лучшей моделью в решении задач администрирования, а Gemini очень неплохо собирает стек, озвучивает лучшие практики, и проектирует приложение.

С кодом и повседневными вопросами (Клода и грока я почти не трогал) я беру Gemini просто из-за удобства для меня.

А ещё я частенько пишу сюжеты, истории и прочие рассказы. Gemini очень неплохо держит фокус и не позволяет своим советам развалится друг об друга. GPT конкретно в этой области значительно слабее.

а с Gemini в свою очередь: "Мало сказано, но задача выполнена".

Наверное потому что это их основной бизнес последнюю четверть века - понять вопрос, чтобы поиск был релевантным.

А Claude не пробовали в написании историй? Мне Sonnet показался хорошо разбирающимся в драматургии и держащим линии героев, особенности локаций и тд.

GPT согласен, вроде как слабее, но при этом - умеющим шутить.

В каких задачах используйте ИИ?

Системы документооборота для Минтруда

Проектирование больше чем кодирование

Я тоже не пишу код. Просто было интересно, спросить.

Доброго дня.

Публично делюсь его развитием у себя в канале https://t.me/founder_build

Результаты тестов есть?

Как и у Карпаты - вопрос в целесообразности.

Напишите статью, что ли…

А что именно интересует в статье? Просто обзор или какие-то юз кейсы?

В планах как раз был пункт чтобы написать статью на примере какого-нибудь рабочего кейса. Но на другой площадке и не скоро еще

Обзорную думал, но почитал ниже, понял, что многие делают себе такого рода тулзы.

так что даже и не знаю….

Довольно очевидная идея, я такое почти год назад делал, в качестве эксперимента.

грок хэви по сути так и работает, там совет моделей

Спасибо, сохранил.

Реклама

Есть такой учёный Мински, ну как есть. Был. Так вот его society of mind лёг в основу труда MIT, DeepMind и ещё в 2023 году они сделали такой совет в виде дебат клуба. Алгоритм и методология не новые, просто руки у Карпаты дошли до этого пет проекта. Статья вот:

https://arxiv.org/pdf/2305.17066.pdf

Гуглы еще в 60-е плотно работали с Мински по ИИ тематике, до того еще как эти два пацана, их основатели, родились.

Шутник, в 60ые гугла не существовало.

Сколько ж оно денег скушает за один консилиум?

Делал я такое прикола ради. Ревью кода отправлял другой модели и вносил правки в соответствии с их комментариями. Потом просил другую модель оценить полученный код и вносил не правки.

Задача была сделать железобетонный бэктест на их основании их советов.

В конце концов вместо качественного кода получился лютый Франкенштейн, рухнувший при первом же тесте на реальной работе.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Другие новости