
Комментарии 24
Да, это уже сделали Blackrock и SakanaAI.
И, да, кроме обезьян из DeepMind (увы, они 3 года запускали нейросети, да. А Илья (якобы) - создатель AlexNet) в одном США с тысячу Иванов из Microsoft.
Планируете ли писать о них? (Что делают, как живут?)
ответы GPT-5.1 он считает слишком многословными, в кто время как Gemini 3 Pro более собранна, а Claude — чрезмерно лаконичен
Решается индивидуальным для каждой llm промптом на сессию, подобранным для выравнивания таких особенностей.
Только надо ли?
совет почти всегда ставит GPT-5.1 на первое место как самую "глубокую и полезную" модель
Я тоже GPT 5.1 high использую.
Модель от Гугл часто уплывает, додумывает, меняет границы задачи, "улучшает" и просто врёт. Поддакивает без добавления своих мыслей. Несмотря на высокие рейтинги я не смог им пользоваться.
Клаудэ периодически впадает в деменцию.
Модель Маска просто болтун
Вот кстати есть ощущение что GPT и Gemini выбираются чисто субъективно. У меня лично опыт с GPT почти всегда: "Много сказано, а задача до сих пор не выполнена", а с Gemini в свою очередь: "Мало сказано, но задача выполнена".
Но это все не 100% и разные задачи разные LLM выполняют с разной степенью успешности. GPT например давно не проверял, но по крайней мере был лучшей моделью в решении задач администрирования, а Gemini очень неплохо собирает стек, озвучивает лучшие практики, и проектирует приложение.
С кодом и повседневными вопросами (Клода и грока я почти не трогал) я беру Gemini просто из-за удобства для меня.
А ещё я частенько пишу сюжеты, истории и прочие рассказы. Gemini очень неплохо держит фокус и не позволяет своим советам развалится друг об друга. GPT конкретно в этой области значительно слабее.
а с Gemini в свою очередь: "Мало сказано, но задача выполнена".
Наверное потому что это их основной бизнес последнюю четверть века - понять вопрос, чтобы поиск был релевантным.
А Claude не пробовали в написании историй? Мне Sonnet показался хорошо разбирающимся в драматургии и держащим линии героев, особенности локаций и тд.
GPT согласен, вроде как слабее, но при этом - умеющим шутить.
В каких задачах используйте ИИ?
Забавно что я выпустил неделю назад аналогичное приложение compary.chat
Публично делюсь его развитием у себя в канале https://t.me/founder_build
Напишите статью, что ли…
А что именно интересует в статье? Просто обзор или какие-то юз кейсы?
В планах как раз был пункт чтобы написать статью на примере какого-нибудь рабочего кейса. Но на другой площадке и не скоро еще
Довольно очевидная идея, я такое почти год назад делал, в качестве эксперимента.
грок хэви по сути так и работает, там совет моделей
Давно сделано. И лучше.
https://github.com/eavookindroid/consilium-agent-tui
Есть такой учёный Мински, ну как есть. Был. Так вот его society of mind лёг в основу труда MIT, DeepMind и ещё в 2023 году они сделали такой совет в виде дебат клуба. Алгоритм и методология не новые, просто руки у Карпаты дошли до этого пет проекта. Статья вот:
Сколько ж оно денег скушает за один консилиум?
Делал я такое прикола ради. Ревью кода отправлял другой модели и вносил правки в соответствии с их комментариями. Потом просил другую модель оценить полученный код и вносил не правки.
Задача была сделать железобетонный бэктест на их основании их советов.
В конце концов вместо качественного кода получился лютый Франкенштейн, рухнувший при первом же тесте на реальной работе.
Андрей Карпати собрал «совет ИИ»: GPT-5.1, Gemini 3 Pro, Claude и Grok спорят за лучший ответ