Новости / Профиль runaway_llm / Хабр

Все потоки

Андрей Пешков@runaway_llm

Пользователь

ПрофильСтатьи18ПостыНовости480Комментарии97

@runaway_llm 21 ноя в 08:47

DeepSeek V3.1 стартовал лучше Gemini 3 Pro и GPT-5.1 в бенчмарке по торговле акциями

2 мин

4.5K

Искусственный интеллектМашинное обучение *

Организаторы бенчмарка Alpha Arena запустили очередной сезон соревнований ИИ на бирже — в этот раз торговля идет не криптовалютами, а акциями, причем на реальные деньги. На старте лидерство захватила DeepSeek V3.1, потеснив в турнирной таблице Gemini 3 Pro и GPT-5.1.

Читать далее

+2

@runaway_llm 21 ноя в 07:55

Google Nano Banana Pro: где попробовать бесплатно и что нового

1 мин

8.8K

Искусственный интеллектМашинное обучение *

Google только что выпустила Nano Banana Pro — свой передовой ИИ для создания изображений на базе Gemini 3 Pro. Но запуск не обошелся без неприятных сюрпризов: практически везде модель доступна только за деньги. Например, в Google AI Studio, где компания обычно дает попробовать свои продукты бесплатно и с щедрыми лимитами, одна генерация в Nano Banana Pro стоит от $0,134 за скромное изображение 1024х1024.

Читать далее

-4

@runaway_llm 20 ноя в 20:01

GPT-5 Pro помогла сделать несколько научных открытий

2 мин

16K

Искусственный интеллектМашинное обучение *

В блоге OpenAI вышла работа, где математики, физики, биологи и информатики с мировым именем рассказывают, как используют GPT-5 Pro в реальных исследованиях — от доказательств теорем до планирования лабораторных опытов. Ключевой формат работы во всех этих историях один и тот же — связка "человек + ИИ". Исследователь формулирует вопрос, задает рамки, подсовывает модели формулы, графики или сырые экспериментальные данные и спорит с ней, а не принимает ответы на веру. GPT-5 Pro в этой схеме — быстрый и эрудированный помощник, который за короткое время перебирает десятки вариантов решения задачи.

Читать далее

-1

@runaway_llm 20 ноя в 13:46

Вышла Nano Banana Pro

1 мин

9.2K

Искусственный интеллектМашинное обучение *

Google начала запуск Nano Banana Pro. Пока что компания не опубликовала никаких анонсов, но у автора этой новости модель уже доступна в Gemini App в подписке Google AI Pro.

Читать далее

+7

@runaway_llm 20 ноя в 09:49

Андрей Карпати рассказал, как его «загазлайтила» Gemini 3 Pro

2 мин

4.6K

Машинное обучение * Искусственный интеллект

Пользователи продолжают делиться отзывами на Gemini 3 Pro — и среди них Андрей Карпати, один из самых известных специалистов по ИИ. В X Андрей написал, что в целом впечатлен новой моделью Google, хотя и подозрительно относится к бенчмаркам. Андрей советует экспериментировать с моделью самостоятельно, внимательно проверяя модель в своих рабочих сценариях.

Читать далее

+5

@runaway_llm 20 ноя в 07:36

xAI выпустила Grok 4.1 Fast: новый ИИ временно доступен бесплатно

2 мин

5.1K

Искусственный интеллектМашинное обучение *

xAI запустила Grok 4.1 Fast — новую модель, заточенную под программирование, работу с инструментами и агентные сценарии. В отличие от Grok 4.1, который вышел в веб-версии и приложениях, Fast-версия заточена под API, причем в ближайшие две недели ей можно будет пользоваться полностью бесплатно.

Читать далее

0

@runaway_llm 20 ноя в 06:36

OpenAI выпустила GPT-5.1 Pro — свой самый мощный ИИ

1 мин

5.1K

Машинное обучение * Искусственный интеллект

OpenAI начала раскатку GPT-5.1 Pro в ChatGPT — модель доступна только подписчикам 200-долларового плана Pro и корпоративного Enterprise. В компании не стали раскрывать цифры бенчмарков, ограничившись утверждением, что это самая передовая модель OpenAI.

Читать далее

0

@runaway_llm 19 ноя в 19:33

Появились примеры работы Nano Banana Pro

1 мин

12K

Искусственный интеллектМашинное обучение *

Сайт TestingCatalog, не раз публиковавший подтверждавшиеся утечки на тему ИИ, выпустил подборку изображений, созданных в новой модели Google — Nano Banana Pro. Все изображения были созданы в 4K, но уменьшены с целью экономии трафика.

Читать далее

+6

@runaway_llm 19 ноя в 18:39

OpenAI выпустила GPT-5.1-Codex-Max — новый лидер в программировании

1 мин

9.7K

Искусственный интеллектМашинное обучение *

OpenAI представила GPT-5.1-Codex-Max - версию GPT-5.1 Thinking, специально заточенную под задачи программирования внутри кодинг-агента Codex. Модель раскатывается во всех версиях Codex для планов ChatGPT Plus, Pro, Edu и Enterprise. Выход в API ожидается позднее.

Читать далее

+2

@runaway_llm 19 ноя в 16:10

«Дочка» Alibaba запустила ИИ-сервис, создающий приложения за 30 секунд

2 мин

8.8K

Машинное обучение * Искусственный интеллект

Ant Group запустила собственного мультимодального ИИ-ассистента LingGuang, которого позиционируют как инструмент для быстрого прототипирования простых приложений. Сервис может за 30-60 секунд собрать так называемые flash apps — мини-программы вроде счетчика калорий, простой аркады в духе Pac-Man или тренажера для запоминания китайских иероглифов.

Читать далее

-2

@runaway_llm 19 ноя в 14:00

OpenAI готовит GPT-5.1-Codex-Max — ответ Gemini 3 Pro

1 мин

7K

Искусственный интеллектМашинное обучение *

В коде агента для программирования Codex нашли упоминание новой модели, GPT-5.1-Codex-Max. Из короткого текстового описания нельзя сделать вывод о возможностях новинки, но указывается, что модель предназначена специально для больших проектов и инженерных задач требующих долгого времени автономной работы.

Читать далее

-3

@runaway_llm 19 ноя в 10:38

Gemini 3 Pro стала первой в дизайне и еще нескольких важных бенчмарках

1 мин

5.3K

Машинное обучение * Искусственный интеллект

Вслед за вчерашним запуском Gemini 3 Pro начали появляться первые независимые оценки ИИ в бенчмарках. Одним из самых интересных стал бенчмарк Design Arena. Это слепое исследование: пользователь пишет промпт на написание кода с элементами дизайна (например, интерфейсом), видит два варианта, выбирает лучший - и только после этого ему сообщается, какие ИИ участвовали. Gemini 3 Pro заняла первое место в этом бенчмарке, победив в четырех из пяти категорий - веб-дизайн, 3D дизайн, компоненты интерфейса и гейм-дизайн. Уступила модель только в визуализации графиков.

Читать далее

-1

@runaway_llm 18 ноя в 21:28

Google представила Gemini 3.0 Deep Think — мощный ИИ для сложных задач

1 мин

12K

Искусственный интеллектМашинное обучение *

Одновременно с запуском Gemini 3.0 Pro в Google рассказали про режим Gemini 3.0 Deep Think, который сейчас проходит финальное тестирование. Это экспериментальный режим параллельных глубоких рассуждений, в котором модель специально заточена под самые сложные задачи в математике, программировании и научном анализе. Отметим, что предыдущая версия — Gemini 2.5 Deep Think — смогла показать результат уровня золотой медали в международной математической олимпиаде.

Читать далее

+9

@runaway_llm 18 ноя в 17:42

Google запустила Antigravity — бесплатную среду для вайб-кодинга на базе Gemini 3 Pro

2 мин

25K

Искусственный интеллектМашинное обучение *

Одновременно с запуском Gemini 3 Pro представлена среда для программирования на базе этой модели — Antigravity. Это бесплатный инструмент для разработчиков, который строится вокруг агентного подхода: вместо одного ассистента здесь целый набор ИИ, умеющих работать с кодом, терминалом и браузером.

Читать далее

+12

@runaway_llm 18 ноя в 15:29

Вышла Gemini 3 Pro — модель можно попробовать бесплатно

1 мин

26K

Машинное обучение * Искусственный интеллект

Google Gemini 3 Pro Perview вышла в Google AI Studio, где ей можно пользоваться бесплатно в том случае, если вы готовы, чтобы Google использовала ваши диалоги для обучения ИИ. Далее ожидается запуск в приложении Gemini, Vertex AI и Google API.

Читать далее

+10

@runaway_llm 18 ноя в 11:49

Gemini 3.0 Pro показала сильный прогресс в сложных бенчмарках

1 мин

6.8K

Искусственный интеллектМашинное обучение *

Несмотря на то, что официальный анонс Gemini 3.0 Pro еще не состоялся, на сайте Google уже опубликована карточка новой модели с основными характеристиками и цифрами по бенчмаркам. Новая модель поддерживает контекстное окно до 1M токенов, а также выход до 64K токенов. В большинстве бенчмарков она показывает существенный прирост как в сравнении с предыдущей 2.5 Pro, так и с основными конкурентами.

Читать далее

+4

@runaway_llm 17 ноя в 23:24

xAI выпустила Grok 4.1 — новый ИИ сразу доступен бесплатно

1 мин

35K

Искусственный интеллектМашинное обучение *

xAI выпустила Grok 4.1, обновленную модель своего ведущего ИИ, который уже доступен в веб-версии и мобильных приложениях на iOS и Android. Модель доступна в быстром и рассуждающем режиме — переключение происходит автоматически, но при необходимости можно нажать Think Harder и включить рассуждения вручную. Grok 4.1 сразу же доступен бесплатно, конкретные лимиты xAI не раскрывает, но в первых отзывах на Reddit говорят, что беседовали с моделью десятки минут, не получив никаких ограничений.

Читать далее

+14

@runaway_llm 17 ноя в 20:48

GPT-5.1 Thinking заняла первое место в одном из самых сложных бенчмарков для ИИ

2 мин

8.7K

Машинное обучение * Искусственный интеллект

GPT-5.1 Thinking пришла первой в бенчмарках ARC-AGI-1 и ARC-AGI-2, которые считаются одними из самых сложных и важных для ИИ. Суть этих бенчмарков в том, что они пытаются замерить не знания модели, а ее способность к абстрактному мышлению в духе человека и способности решать задачи, которые он никогда не видел.

Читать далее

+3

@runaway_llm 17 ноя в 19:34

В новом бенчмарке на галлюцинации лишь три ИИ чаще отвечают правильно, чем ошибаются

2 мин

6.7K

Искусственный интеллектМашинное обучение *

Artificial Analysis представила новый бенчмарк AA-Omniscience, который оценивает уровень галлюцинаций не только по количеству правильных ответов, но и по умению моделей говорить "не знаю". Первые три места занимают ИИ из линейки Claude: маленькая Claude 4.5 Haiku показывает около 26% неверных ответов среди всех неудачных попыток, а Claude 4.5 Sonnet и Claude 4.1 Opus делят второе и третье место с результатом 48%. Важно добавить, что в бенчмарке моделям отключили возможность поиска в сети и задавали максимально сложные вопросы — в реальных задачах количество ошибок существенно ниже, а бенчмарк в первую очередь должен показать разработчикам ИИ слабые места в текущих схемах тренировки.

Читать далее

+2

@runaway_llm 17 ноя в 15:40

DeepSeek, Qwen и Kimi вытесняют американский ИИ из Кремниевой долины

2 мин

11K

Искусственный интеллектМашинное обучение *

Обозреватель Bloomberg Opinion Кэтрин Торбек пишет о развороте в Кремниевой долине: все больше местных компаний строят свои сервисы на ИИ из Китая, в первую очередь — DeepSeek, Qwen и Kimi. Несмотря на то, что США и Китай ведут практически открытую ИИ-гонку, американский бизнес предпочитает китайские модели за дешевизну, производительность и открытость, которая упрощает дообучение под нужные задачи.

Читать далее

+16

3

4 5 ...