Обновить
25
141.4
Андрей Пешков@runaway_llm

Пользователь

Отправить сообщение

DeepSeek V3.1 стартовал лучше Gemini 3 Pro и GPT-5.1 в бенчмарке по торговле акциями

Время на прочтение2 мин
Охват и читатели4.5K

Организаторы бенчмарка Alpha Arena запустили очередной сезон соревнований ИИ на бирже — в этот раз торговля идет не криптовалютами, а акциями, причем на реальные деньги. На старте лидерство захватила DeepSeek V3.1, потеснив в турнирной таблице Gemini 3 Pro и GPT-5.1.

Читать далее

Google Nano Banana Pro: где попробовать бесплатно и что нового

Время на прочтение1 мин
Охват и читатели8.8K

Google только что выпустила Nano Banana Pro — свой передовой ИИ для создания изображений на базе Gemini 3 Pro. Но запуск не обошелся без неприятных сюрпризов: практически везде модель доступна только за деньги. Например, в Google AI Studio, где компания обычно дает попробовать свои продукты бесплатно и с щедрыми лимитами, одна генерация в Nano Banana Pro стоит от $0,134 за скромное изображение 1024х1024.

Читать далее

GPT-5 Pro помогла сделать несколько научных открытий

Время на прочтение2 мин
Охват и читатели16K

В блоге OpenAI вышла работа, где математики, физики, биологи и информатики с мировым именем рассказывают, как используют GPT-5 Pro в реальных исследованиях — от доказательств теорем до планирования лабораторных опытов. Ключевой формат работы во всех этих историях один и тот же — связка "человек + ИИ". Исследователь формулирует вопрос, задает рамки, подсовывает модели формулы, графики или сырые экспериментальные данные и спорит с ней, а не принимает ответы на веру. GPT-5 Pro в этой схеме — быстрый и эрудированный помощник, который за короткое время перебирает десятки вариантов решения задачи.

Читать далее

Вышла Nano Banana Pro

Время на прочтение1 мин
Охват и читатели9.2K

Google начала запуск Nano Banana Pro. Пока что компания не опубликовала никаких анонсов, но у автора этой новости модель уже доступна в Gemini App в подписке Google AI Pro.

Читать далее

Андрей Карпати рассказал, как его «загазлайтила» Gemini 3 Pro

Время на прочтение2 мин
Охват и читатели4.6K

Пользователи продолжают делиться отзывами на Gemini 3 Pro — и среди них Андрей Карпати, один из самых известных специалистов по ИИ. В X Андрей написал, что в целом впечатлен новой моделью Google, хотя и подозрительно относится к бенчмаркам. Андрей советует экспериментировать с моделью самостоятельно, внимательно проверяя модель в своих рабочих сценариях.

Читать далее

xAI выпустила Grok 4.1 Fast: новый ИИ временно доступен бесплатно

Время на прочтение2 мин
Охват и читатели5.1K

xAI запустила Grok 4.1 Fast — новую модель, заточенную под программирование, работу с инструментами и агентные сценарии. В отличие от Grok 4.1, который вышел в веб-версии и приложениях, Fast-версия заточена под API, причем в ближайшие две недели ей можно будет пользоваться полностью бесплатно.

Читать далее

OpenAI выпустила GPT-5.1 Pro — свой самый мощный ИИ

Время на прочтение1 мин
Охват и читатели5.1K

OpenAI начала раскатку GPT-5.1 Pro в ChatGPT — модель доступна только подписчикам 200-долларового плана Pro и корпоративного Enterprise. В компании не стали раскрывать цифры бенчмарков, ограничившись утверждением, что это самая передовая модель OpenAI.

Читать далее

Появились примеры работы Nano Banana Pro

Время на прочтение1 мин
Охват и читатели12K

Сайт TestingCatalog, не раз публиковавший подтверждавшиеся утечки на тему ИИ, выпустил подборку изображений, созданных в новой модели Google — Nano Banana Pro. Все изображения были созданы в 4K, но уменьшены с целью экономии трафика.

Читать далее

OpenAI выпустила GPT-5.1-Codex-Max — новый лидер в программировании

Время на прочтение1 мин
Охват и читатели9.7K

OpenAI представила GPT-5.1-Codex-Max - версию GPT-5.1 Thinking, специально заточенную под задачи программирования внутри кодинг-агента Codex. Модель раскатывается во всех версиях Codex для планов ChatGPT Plus, Pro, Edu и Enterprise. Выход в API ожидается позднее.

Читать далее

«Дочка» Alibaba запустила ИИ-сервис, создающий приложения за 30 секунд

Время на прочтение2 мин
Охват и читатели8.8K

Ant Group запустила собственного мультимодального ИИ-ассистента LingGuang, которого позиционируют как инструмент для быстрого прототипирования простых приложений. Сервис может за 30-60 секунд собрать так называемые flash apps — мини-программы вроде счетчика калорий, простой аркады в духе Pac-Man или тренажера для запоминания китайских иероглифов.

Читать далее

OpenAI готовит GPT-5.1-Codex-Max — ответ Gemini 3 Pro

Время на прочтение1 мин
Охват и читатели7K

В коде агента для программирования Codex нашли упоминание новой модели, GPT-5.1-Codex-Max. Из короткого текстового описания нельзя сделать вывод о возможностях новинки, но указывается, что модель предназначена специально для больших проектов и инженерных задач требующих долгого времени автономной работы.

Читать далее

Gemini 3 Pro стала первой в дизайне и еще нескольких важных бенчмарках

Время на прочтение1 мин
Охват и читатели5.3K

Вслед за вчерашним запуском Gemini 3 Pro начали появляться первые независимые оценки ИИ в бенчмарках. Одним из самых интересных стал бенчмарк Design Arena. Это слепое исследование: пользователь пишет промпт на написание кода с элементами дизайна (например, интерфейсом), видит два варианта, выбирает лучший - и только после этого ему сообщается, какие ИИ участвовали. Gemini 3 Pro заняла первое место в этом бенчмарке, победив в четырех из пяти категорий - веб-дизайн, 3D дизайн, компоненты интерфейса и гейм-дизайн. Уступила модель только в визуализации графиков.

Читать далее

Google представила Gemini 3.0 Deep Think — мощный ИИ для сложных задач

Время на прочтение1 мин
Охват и читатели12K

Одновременно с запуском Gemini 3.0 Pro в Google рассказали про режим Gemini 3.0 Deep Think, который сейчас проходит финальное тестирование. Это экспериментальный режим параллельных глубоких рассуждений, в котором модель специально заточена под самые сложные задачи в математике, программировании и научном анализе. Отметим, что предыдущая версия — Gemini 2.5 Deep Think — смогла показать результат уровня золотой медали в международной математической олимпиаде.

Читать далее

Google запустила Antigravity — бесплатную среду для вайб-кодинга на базе Gemini 3 Pro

Время на прочтение2 мин
Охват и читатели25K

Одновременно с запуском Gemini 3 Pro представлена среда для программирования на базе этой модели — Antigravity. Это бесплатный инструмент для разработчиков, который строится вокруг агентного подхода: вместо одного ассистента здесь целый набор ИИ, умеющих работать с кодом, терминалом и браузером.

Читать далее

Вышла Gemini 3 Pro — модель можно попробовать бесплатно

Время на прочтение1 мин
Охват и читатели26K

Google Gemini 3 Pro Perview вышла в Google AI Studio, где ей можно пользоваться бесплатно в том случае, если вы готовы, чтобы Google использовала ваши диалоги для обучения ИИ. Далее ожидается запуск в приложении Gemini, Vertex AI и Google API.

Читать далее

Gemini 3.0 Pro показала сильный прогресс в сложных бенчмарках

Время на прочтение1 мин
Охват и читатели6.8K

Несмотря на то, что официальный анонс Gemini 3.0 Pro еще не состоялся, на сайте Google уже опубликована карточка новой модели с основными характеристиками и цифрами по бенчмаркам. Новая модель поддерживает контекстное окно до 1M токенов, а также выход до 64K токенов. В большинстве бенчмарков она показывает существенный прирост как в сравнении с предыдущей 2.5 Pro, так и с основными конкурентами.

Читать далее

xAI выпустила Grok 4.1 — новый ИИ сразу доступен бесплатно

Время на прочтение1 мин
Охват и читатели35K

xAI выпустила Grok 4.1, обновленную модель своего ведущего ИИ, который уже доступен в веб-версии и мобильных приложениях на iOS и Android. Модель доступна в быстром и рассуждающем режиме — переключение происходит автоматически, но при необходимости можно нажать Think Harder и включить рассуждения вручную. Grok 4.1 сразу же доступен бесплатно, конкретные лимиты xAI не раскрывает, но в первых отзывах на Reddit говорят, что беседовали с моделью десятки минут, не получив никаких ограничений.

Читать далее

GPT-5.1 Thinking заняла первое место в одном из самых сложных бенчмарков для ИИ

Время на прочтение2 мин
Охват и читатели8.7K

GPT-5.1 Thinking пришла первой в бенчмарках ARC-AGI-1 и ARC-AGI-2, которые считаются одними из самых сложных и важных для ИИ. Суть этих бенчмарков в том, что они пытаются замерить не знания модели, а ее способность к абстрактному мышлению в духе человека и способности решать задачи, которые он никогда не видел.

Читать далее

В новом бенчмарке на галлюцинации лишь три ИИ чаще отвечают правильно, чем ошибаются

Время на прочтение2 мин
Охват и читатели6.7K

Artificial Analysis представила новый бенчмарк AA-Omniscience, который оценивает уровень галлюцинаций не только по количеству правильных ответов, но и по умению моделей говорить "не знаю". Первые три места занимают ИИ из линейки Claude: маленькая Claude 4.5 Haiku показывает около 26% неверных ответов среди всех неудачных попыток, а Claude 4.5 Sonnet и Claude 4.1 Opus делят второе и третье место с результатом 48%. Важно добавить, что в бенчмарке моделям отключили возможность поиска в сети и задавали максимально сложные вопросы — в реальных задачах количество ошибок существенно ниже, а бенчмарк в первую очередь должен показать разработчикам ИИ слабые места в текущих схемах тренировки.

Читать далее

DeepSeek, Qwen и Kimi вытесняют американский ИИ из Кремниевой долины

Время на прочтение2 мин
Охват и читатели11K

Обозреватель Bloomberg Opinion Кэтрин Торбек пишет о развороте в Кремниевой долине: все больше местных компаний строят свои сервисы на ИИ из Китая, в первую очередь — DeepSeek, Qwen и Kimi. Несмотря на то, что США и Китай ведут практически открытую ИИ-гонку, американский бизнес предпочитает китайские модели за дешевизну, производительность и открытость, которая упрощает дообучение под нужные задачи.

Читать далее

Информация

В рейтинге
42-й
Зарегистрирован
Активность

Специализация

Директор по контенту
Ведущий
Управление проектами
Планирование
Стратегическое планирование
Построение команды
Бюджетирование проектов
Организация бизнес-процессов