По последним утечкам, DeepThink уже больше чем просто Gemini 2.5 Pro с увеличенным временем рассуждения. Например, модель параллельно может прорабатывать несколько вариантов решения задачи, а затем брать лучший (так Grok 4 Heavy ещё умеет). Жаль только, что Google задерживает выход - из сегодняшней новости я понял, что опять будет тестирование и только потом релиз в подписке Ultra.
Кстати, решения задач модели от OpenAI вы раскритиковали. У Google получилось лучше?
Пробовали в том же ChatGPT Operator - у современных ИИ пока не очень получается кликать мышкой. Поэтому сменили подход. Есть еще Google CLI - тот вообще через командную строку ПК управляет.
Спасибо за замечание, я дополнил новость - "Анализировались в первую очередь диалоги с участием двух и более спикеров, чтобы исключить случаи сценариев, написанных ИИ"
Отчет Microsoft в новости пересказали не полностью: 2397 долларов - это не стоимость работы ИИ, а стоимость постановки диагноза целиком, включая проведение анализов и тестов. Учитывайте, что речь о США, там все медицинские обследования существенно дороже.
Если поздняя версия V3, то ничего странного, она на равных с ранней R1. В интернет лазать было запрещено всем моделям, вместо этого им давали работы из архива научных материалов. Этот момент в тесте мне нравится меньше всего.
Пишут, что интерфейс английский, но команды понимает на 40 языках - в том числе и русском. Это же обычная 2.5 Pro, а у нее с пониманием нашего языка все очень хорошо.
Ну вот текущее решение суда ведет к тому, что нельзя запретить использование книги для обучения нейросетей - так же, как, например, автор книги не может запретить писать рецензии на нее.
По последним утечкам, DeepThink уже больше чем просто Gemini 2.5 Pro с увеличенным временем рассуждения. Например, модель параллельно может прорабатывать несколько вариантов решения задачи, а затем брать лучший (так Grok 4 Heavy ещё умеет). Жаль только, что Google задерживает выход - из сегодняшней новости я понял, что опять будет тестирование и только потом релиз в подписке Ultra.
Кстати, решения задач модели от OpenAI вы раскритиковали. У Google получилось лучше?
Сэм Альтман уже после презентации выпустил пост о безопасности ChatGPT Agen, как будет свободное время - напишу отдельную новость по мотивам.
Пробовали в том же ChatGPT Operator - у современных ИИ пока не очень получается кликать мышкой. Поэтому сменили подход. Есть еще Google CLI - тот вообще через командную строку ПК управляет.
Дополнил новость - "Анализировались в первую очередь диалоги с участием двух и более спикеров, чтобы исключить случаи сценариев, написанных ИИ"
Спасибо за замечание, я дополнил новость - "Анализировались в первую очередь диалоги с участием двух и более спикеров, чтобы исключить случаи сценариев, написанных ИИ"
Я немного подправил оригинальный заголовок, первая версия действительно была кликбейтной.
Скандал с ботом в X случился ещё до выхода Grok 4, к поиску по твитам Маска он не относится.
И по твитам он, похоже, тоже искать перестал - завтра погоняю на разных запросах, если будет результат, напишу пост.
А можете ссылку на диалог дать? У меня искало по твитам Маска, но интересно понять, почему у другого пользователя пошло иначе
На каком промпте (промптах) пробовали?
300 в год - это обычный SuperGrok.
SuperGrok Heavy стоит 3000 в год. Но видел уже людей, подписавшихся.
Для программирования тренируют Grok 4 Coder, выпустить обещают в августе.
У меня есть подписка, свои промты могу сам протестить. Просто любопытно, где именно модель подвела вас.
А тестили на каких промптах?
Отчет Microsoft в новости пересказали не полностью: 2397 долларов - это не стоимость работы ИИ, а стоимость постановки диагноза целиком, включая проведение анализов и тестов. Учитывайте, что речь о США, там все медицинские обследования существенно дороже.
поправил, спасибо!
Почему? Сейчас мало работаю с Гроком, но когда память только вводили - пробовал, он что-то подбирал из старых диалогов.
Если поздняя версия V3, то ничего странного, она на равных с ранней R1. В интернет лазать было запрещено всем моделям, вместо этого им давали работы из архива научных материалов. Этот момент в тесте мне нравится меньше всего.
Нет, у DeepSeek две версии: V3 без рассуждений, а R1 рассуждающая. R1 тоже неплохие результаты показал.
Пишут, что интерфейс английский, но команды понимает на 40 языках - в том числе и русском. Это же обычная 2.5 Pro, а у нее с пониманием нашего языка все очень хорошо.
Ну вот текущее решение суда ведет к тому, что нельзя запретить использование книги для обучения нейросетей - так же, как, например, автор книги не может запретить писать рецензии на нее.