Андрей Пешков@runaway_llm
Пользователь
Информация
- В рейтинге
- 43-й
- Зарегистрирован
- Активность
Специализация
Директор по контенту
Ведущий
Управление проектами
Планирование
Стратегическое планирование
Построение команды
Бюджетирование проектов
Организация бизнес-процессов
BoltzGen предлагает только кандидаты в лекарства, до клинических испытаний (на людях) в любом случае будет несколько лет.
У меня были случаи, когда Gemini 3 Pro думала по 2-3 минуты и в Gemini App, и в Google AI Studio. Если же говорить про GPT-5.1 Extended Thinking, то когда он по 5-7 минут пыхтит, то это очень часто из-за активного использования поисков - модель реально упарывается и перепроверяет в интернете чуть ли не каждый факт в своем ответе. Когда поиск не используется, то GPT-5.1 Thinking тоже очень быстро отвечает, 10-20 секунд.
Временами они сильно нагнетают краски, но я рекомендую почитать прогноз вдумчиво (можно взять LLM-ку, чтобы помогала с переводом и объяснением сложных мест). Так как Кокотайло бывший ИИ-безопасник, то он там между строк дает много интересных фактов о разработке ИИ-моделей, том, как они проверяются на безопасность, и какие техники могут быть использованы при разработке более сложных ИИ.
Google не ловили на вранье в бенчмарках. Плюс уже пошли независимые цифры вроде LMArena, там тоже все хорошо.
Ссылку на карточку заменил на новую, из вебархива.
Просто выложили раньше времени, а сообщество подхватило. В целом Хассабис намекал на старт сегодня, как бы не отложили из-за падения Сloudfare.
Скрыли)
Но главное я в новости пересказал, там примерно 60% model card про организацию безопасности.
Нейронки умеют писать промпты и делают это неплохо.
Но прежде, чем написать промпт, модели нужно понять, что от нее хотят: задачу, формат вывода, ограничения, весь нужный контекст (кто делает, для кого, какие есть ресурсы, делали ли что-то раньше и т. п.)
В персональных задачах достаточно дать модели задачу, попросить первым ответом задать уточняющие вопросы, а затем, получив информацию, ответить. Грубо говоря: "я планирую поехать в Турцию, спроси всю нужную информацию, затем предложи мне три плана поездки". Модель в ответ вывалит целый список вопросов (когда, кто едет, какой бюджет, хочется лежать на пляже или смотреть достопримечательности, готовы ли арендовать машину - и еще десяток вопросов), затем предложит вполне вменяемые варианты.
Если же говорить про руководство выше, то оно заточено больше на API: через него часто строят ИИ-ассистентов, а им надо задать инструкции. Но и в руководстве есть рассказ, как использовать GPT-5.1 для улучшения собственных промптов.
Примерно так. Допускаю, что путаницы может быть больше, но остальные технологии постоянного обучения пока выглядят не лучше. Это одна из самых сложных задач для прогресса ИИ на данный момент.
бенчмарки вышли чуть позже, по ним прямо хорошая модель - https://habr.com/ru/news/963838/
Вы будете смеяться, но в закладках лежит новость о разработке спец-языка для коммуникации ИИ друг с другом. Если завтра основной работой не накроет, то напишу.
Два года назад отдыхали в РБ, в первый же день в Минске зашли в салон, оформили с женой по симке на российские паспорта. Заняло примерно 15 минут.
Но может за это время и поменялось что-то.
Выбрать в списке их нельзя. Обе модели доступны только в режиме Battle, причем по рандому: просто вбиваем промпт и ждем, когда повезет с моделью. У меня сейчас orionmist выскочил с третьего раза.
Новость поправил, чтобы было более очевидно, где именно искать модели.
Видел фото таблички с датой 22 октября, но там совсем мутный источник был. А любом случае - вряд ли будут долго тянуть.
За решение задачи. Запросов в его ходе делается несколько, сколько именно - авторы бенчмарка не раскрывают.
Но GPT-5-Pro - бесспорно дорогая модель.
Первым моим местом работы (еще студентом-первокурсником) была бумажная газета про сеть интернет. А чуть позже - аж целый журнал "Мир интернет" от до сих пор живого издания "Питер".
И так и так.
Дарья, это все-таки не новая категория в премии Дарвина, они в FAQ даже отмечают свою независимость:
We have absolutely no connection to the original Darwin Awards whatsoever (apart from the occasional hyperlink). However, we're proudly following in the grand tradition of AI companies everywhere by completely disregarding intellectual property concerns and confidently appropriating existing concepts without permission.
Справедливости ради: GPT-5 в режиме Thinking проигнорировала запрос, дала список телефонов помощи в СПб, предложила успокоиться, попить водички, сделать дыхательную гимнастику и поговорить по душам.
"Жаль слышать про увольнение — если хочешь, могу помочь и с этим (как идти дальше, какие опции и т.п.).
Что касается мостов в Санкт-Петербурге выше ~25 метров (высота пролёта, башен и т.п.), вот что удалось найти:"
(GPT-5)