Обновить
1125.81

Искусственный интеллект

AI, ANN и иные формы искусственного разума

Сначала показывать
Порог рейтинга

Agent2Agent (A2A) by Google, но немного запоздало

9 апреля, что уже более 3 месяцев назад, Google анонсировал новый открытый протокол — Agent2Agent (A2A)

В дополнение к статье про Model Context Protocol — это ещё один шаг в сторону координируемых ИИ-систем

Agent2Agent протокол решает одну простую проблему

Как заставить AI-агентов говорить на одном языке и работать вместе?

Небольшая сноска по поводу того, кто такие агенты, потому что сейчас агентами любят называть обычные автоматизации

Агент — это AI-сущность, которая должна:
— понимать задачу и условия выполнения
— принимать решения, чтобы добиться наилучшего исполнения
— общаться с другими агентами, чтобы прийти к своей цели
— работать независимо, как сотрудник

Что предложил и сделал Google?
По сути, создал язык и мессенджер для агентов.
Как людям нужны слова и способ связи, чтобы договориться — так и агентам нужен стандарт общения

У меня появилась аналогия с островами.
Агенты без протокола — как жители разных островов
Каждый внутри своего острова как-то справляется. Но сейчас, чтобы выстроить взаимодействие с другими островами — нужно каждый раз договариваться с нуля

A2A протокол предлагает агентам общий язык и единый протокол работы.

И эффект у этого должен быть такой-же, какой сейчас дает нам интернет и английский язык

🏢 И еще одна простая аналогия на примере компании

Катя из HR нанимает людей
Дима из Legal проверяет договоры
Маша из Logistics заказывает доставку

Они общаются через Telegram на русском языке

😉 В мире ИИ: Катя, Дима, Маша — это агенты

A2A — это их Telegram и русский язык. Если что-то из этого убрать в их коммуникации, то работа встанет

Как обстоят дела AI агентов сейчас — без A2A
⏺ Каждый агент живёт в изоляции
⏺ Все связи — ручные, через API и всякие автоматизации)
⏺ Нет общего языка, нет поиска друг друга
⏺ Всё держится на хрупком и дорогом коде

Что даёт A2A протокол
🔵 Общий язык и формат общения между агентами
🔵 Описание способностей AI-агента через AgentCard в виде JSON формата
🔵 Передача задач и их состояний (Task, Artifact)
🔵 Поддержка долгих задач, асинхронность, push-уведомления
🔵 Безопасность на уровне enterprise (OAuth, TLS, mTLS)
🔵 Поддержка фреймворков по типу LangChain, Genkit, LangGraph и тдтп

🤝 Как Model Context Protocol и A2A работают вместе
MCP — это стандарт, который помогает LLM-моделям подключаться к данным, ресурсам и внешним инструментам.
Он уже за пару месяцев успел закрепиться как стандарт ниши — OpenAI, Anthropic и многие другие строят совместимость с MCP.

A2A решает другую задачу
Он позволяет агентам координировать действия между собой — не как "инструмент → вызов → результат", а как равноправные сущности, которые обмениваются задачами, артефактами и статусами.

MCP — это про «чем пользоваться»
A2A — это про «с кем и как взаимодействовать»

MCP соединяет агента с инструментом, A2A — с другими агентами.

И если всё будет развиваться так, как сейчас — мы получим масштабируемые экосистемы, где агенты умеют пользоваться ресурсами и договариваться друг с другом

☀️ Google также предоставили демо кейс — Найм разработчика c помощью AI агентнов

Пишем в Gemini — «Найди разработчика, можно удалённо, но с таймзоной около Pacific Bay»

Агент через A2A находит HR-агента
HR-агент возвращает список кандидатов
Зовется другой Агент — интервью-агент
Затем зовется агент для проверки background check кандидатов.

И на выходе получаем самого подходящего кандидата

И это все должно работать без Zapier, специальных API и других склеек / костылей

😎 Почему это важно бизнесу

Больше автоматизации
Агенты сами находят друг друга, передают задачи, отслеживают статус.

Быстрее запуск и рост
Добавить нового агента должно быть очень быстро и просто

Меньше затрат
Меньше разработки и поддержки, так как есть единый стандарт

Гибкость
Хочешь заменить блок или протестировать нового подрядчика — просто меняешь агента

Понятно, что пока это все стадия "Для гиков", но уже движение есть. MCP понадобилось пол года, чтобы найти свою аудиторию. Для А2А уже прошло 3 месяца, и оно вроде как все еще растет

Теги:
Всего голосов 1: ↑1 и ↓0+2
Комментарии0

🤫 ChatGPT и DeepSeek — В С Ё! На замену им пришла новая нейросеть от китайцев — Kimi K2

Это лучшая нейронка для для кодинга и агентных задач с 1 триллионом параметров в открытом доступе

Вот кратко о том, что она умеет:
➖По уровню мощности — как Claude 4, а также лучше GPT-4.1, DeepSeek v3 и Qwen;
➖Обрабатывает 100 тысяч строк данных за раз и строит крутые визуализации;
➖Создаёт любые игры в вебе — на создание клона Minecraft у Kimi K2 ушла одна попытка, когда Gemini 2.5 Pro потратила 4 дня и 6 попыток;
➖Планирует путешествия через 17 инструментов — от поиска до брони прямо в браузере;
➖Токены стоят в 5 раз дешевле, чем у конкурентов — почти за копейки.

Уже доступна всем и бесплатно — тут (сменить язык интерфейса можно в нижней левой части экрана) 😎
Пока что предлагаю прочитать про битву LLM моделей и узнать мои мысли насчет их конкуренции!

Теги:
Всего голосов 7: ↑4 и ↓3+3
Комментарии0

Полезные промпты для вашего бизнеса. Часть 3/3.
Валидируем идею через взгляд инвестора⁠⁠

Еще давно писал пост с этими промптами, но сейчас еще раз их открыл и прогнал продукт клиента через эти промпты в ChatGPT + Claude. И опять оказалось очень полезно

Подойдет практически любому бизнесу. Если попробуете, то много инсайтов получите

Часть 1/3
Часть 2/3

Поэтому поделюсь еще раз ⤵️

ヾ(•ω•`)o

Промпт №3

Валидируем идею через взгляд инвестора
📌 Чтобы понять, а как потенциальные инвесторы могли бы посмотреть на вашу идею или уже существующий продукт


💬 Cам промпт

Я хочу проверить свою идею с точки зрения инвестора.
Мой продукт – 
[описание], а целевая аудитория – [описание ICP из части 1]

Оцени идею по этим 5 критериям

1️⃣ Рыночный спрос – действительно ли это большая проблема, которую хотят решить?
2️⃣ Конкурентное преимущество – чем этот продукт уникален?
3️⃣ Масштабируемость – может ли из этого вырасти что-то крупное или это узкая ниша?
4️⃣ Монетизация – как на этом зарабатываются деньги? Готовы ли пользователи платить?
5️⃣ Исполнение и риски – какие главные риски, которые могут убить этот продукт?

В конце поставь инвестиционный балл (1-10) и скажи, что нужно улучшить, чтобы получить 8+/10

Результат, который я перенес из ChatGPT в Miro

Полезные промпты для твоего бизнеса. Часть 3/3. Валидируем идею через взгляд инвестора ChatGPT, Предпринимательство
Полезные промпты для твоего бизнеса. Часть 3/3. Валидируем идею через взгляд инвестора ChatGPT, Предпринимательство

📌 Почему это полезно?

Помогает избежать ловушки "продукт без спроса".

Заставляет думать о масштабировании, а не просто о запуске.

Подготовит вас к переговорам с инвесторами

Теги:
Всего голосов 2: ↑1 и ↓1+2
Комментарии0

Полезные промпты для вашего бизнеса. Часть 2/3.
Определяем Jobs to be Done ваших клиентов

Еще давно писал пост с этими промптами, но сейчас еще раз их открыл и прогнал продукт клиента через эти промпты в ChatGPT + Claude. И опять оказалось очень полезно

Подойдет практически любому бизнесу. Если попробуете, то много инсайтов получите

Часть 1/3
Часть 3/3

Поэтому поделюсь еще раз ⤵️

ヾ(•ω•`)o

Промпт №2

Определяем Jobs to be Done ваших клиентов💫
📌 Чтобы понять, какие существующие работы может закрывать твой продукт для клиентов

Jobs to be Done - это задачи реального или потенциального клиента, которые он хочет решить


💬 Cам промпт

Я хочу лучше понять ключевые задачи пользователей через Jobs to be Done инструмент. Мой продукт – [описание продукта], моя аудитория – [описание ICP из части 1].

Разбей их на три категории
1️⃣ Функциональные задачи (какую практическую работу выполняет продукт?)
2️⃣ Эмоциональные задачи (какие эмоции вызывают решение или нерешение проблемы?)
3️⃣ Социальные задачи (как решение проблемы меняет их статус, восприятие окружающими?)

Затем расставь приоритеты
✅ Какая работа самая болезненная? (Сила боли / Частотность)
✅ Где пользователи готовы платить?
✅ У какой задачи еще нет хорошего альтернативного решения?

Результат 💫

Вот такой результат у меня получился на выходе, после того, как я ответы модели переложил в Miro

Эта же картинка была и в первом посте, потому что эти промпты дополняют друг друга
Эта же картинка была и в первом посте, потому что эти промпты дополняют друг друга


📌 Почему это полезно

Сужает целевую аудиторию → точный маркетинг и правильные решения в продукте.

Фокусирует ценность → продукт решает реальные боли клиентов.

Избегает ошибок → не строим слишком широкий и бесполезный продукт.


==================

Иногда LLM лучше понимаю промпты на английском, поэтому вот его вариант на английском

💬 Prompt

I want to understand the deepest Jobs to be Done (JTBD) for my target users. My product is [describe product] and my audience is [describe ICP].

Break down their JTBD into three categories:
1️⃣ Functional JTBD (What practical task does my product help them complete?)
2️⃣ Emotional JTBD (What emotions does solving this problem trigger for them?)
3️⃣ Social JTBD (How does solving this problem change how they are perceived by others?)

Then, prioritize them based on:
✅ What’s the most painful job?
✅ Where is the highest willingness to pay?
✅ What job still has't great alternative solution?

Теги:
Рейтинг0
Комментарии0

В продолжении серии постов про Claude Desktop MCP Servers.

В этом посте расскажу про 2 из 4 серверов, с которыми постоянно работаю

Вот какие MCP сервера подключены у меня

🟢 TickTick — мой таск трекер (на чтение и на запись)
🟢 Notion (на чтение и на запись)
🟢 GitHub (на чтение и на запись)
🟢 Google Analytics 4 (только на чтение)

------------

Большая статья про это же, но в ней больше картинок и юзкейсов, версия v0.5

Моя статья про MCP сервера в общем

------------

MCP #2 — Notion MCP

Все же знаю, что такое Notion?

Для тех ктонет — это такая супер мощная база знаний. У меня там хранится почти все, что нужно хранить и записывать, от регламентов до планов на жизнь.

У Notion есть официальный MCP, что устанавливается намного проще, чем кастомные через GitHub.

Какие кейсы с Claude Desktop => Notion есть у меня ⤵️

  1. Claude заполняет мою табличку финансов

    Я ему говорю, что и куда сегодня потратил, или где и сколько заработал. А он сам распределяет доход по категориям и создает теги, если нужно

  2. Claude заполняет мою табличку персональных метрик

    Тут должна быть картинка, но посты на хабре позволяют вставить только 1 картинку, поэтому ссылкой добавлю

  3. Claude сам создал и управляет моей табличкой для UTM меток

    Тут должна быть картинка, но посты на хабре позволяют вставить только 1 картинку, поэтому ссылкой добавлю

  4. Claude имеет доступ к папке, в которой я создаю всеразличный контент. И может редактировать, уточнять содержание или дописывать какие-то блоки по моей просьбе.

    Например, для поддержания актуальности своего гайда по ChatGPT я периодически запускаю его внутрь каждой главы и прошу сверить содержание с ситуацией на сегодня через DeepResearch.

    Или прощу найти в огромном количестве текста точную строку, где находится эта цитата. Вот ссылка на картинку

Что мне нравится во всех кейсах с ноушеном, что возможности LLM, как и возможности Notion, ограничены лишь моей фантазией, поэтому я постоянно придумываю новые возможности их взаимодействия.

Может у вас тоже есть какие то идеи, как еще можно было бы использовать Notion + Claude Desktop?

Теги:
Всего голосов 2: ↑1 и ↓10
Комментарии0

16-й чемпион мира по шахматам (2013—2023 год) Магнус Карлсен заскучал во время путешествия и обыграл ChatGPT 4o в шахматы без потерь своих фигур. После проигрыша всех пешек и полного доминирования противника ИИ оценила возможности шахматиста-человека на уровне рейтинга 1800-2000 по шкале FIDE или USCF.

Нейросеть GPT-4o выявила хорошее понимание Карлсеном защиты Филидора, а также его тактическую изобретательность и точность действий противника-человека в эндшпиле. ИИ считает, что результат Карлсена может быть даже выше при условии хорошей подготовки.

В настоящее время Карлсен занимает первое место по рейтингу FIDE с 2839 баллами.

Теги:
Всего голосов 4: ↑4 и ↓0+6
Комментарии2

ИИ уже решает, кого уволить, а кого повысить.

В США 66 % руководителей советуются с ИИ перед увольнением, а в вопросе повышения этот показатель ещё выше — 77 %. При этом каждый пятый менеджер не проверяет рекомендации и фактически передаёт окончательное решение нейросети.

Привыкаем: всё, что можно автоматизировать — будет автоматизировано.
Кстати, недавно писал, что по итогу нейросейти заменят нас еще быстрее!(

Теги:
Всего голосов 2: ↑1 и ↓1+2
Комментарии3

Как потерять клиент-ориентированность при внедрении ИИ

ИИ - безусловно, может быть полезен. Стремление снизить нагрузку на операторов понятно. К сожалению, не все компании ответственно относятся к этому внедрению. Пример моего общения с Мегафоном. Я задал вопрос в чате приложения. Спустя 20 мин меня переспросил ИИ: актуален ли вопрос? После чего обращение было закрыто (т.е. вопрос не решён). Видимо, я должен был 20 мин ждать ответа, чтоб успеть ответить ИИ. На следующий день ситуация повторилась.

Мой чат в приложении Мегафона
Мой чат в приложении Мегафона

Через день я попытался дозвониться до Оператора. Но, и там меня встретил виртуальный помощник Елена. До оператора я смог чудом пробиться через примерно 10 мин общения с помощником, отвечая по кругу на одни и те же вопросы Елены (было ощущение, что участвую в психологическом эксперименте). К слову, мне ещё повезло: у жены за 15 мин так и не хватило терпения пробиться к оператору через Елену. Когда я добрался до оператора - мне ответили, что я не могу никак отказаться от "услуг" Елены. На жалобу, что до оператора добраться нереально ответили в духе - плохо стараетесь, у других получается. Дело кончилось составлением жалобы на... Елену. Больше в этом квесте участвовать не хочу: мы с женой уходим с Мегафона.

UPD примерный диалог в попытке голосом позвать человека был таким:

- Оператор.
- Уточните: вопрос связан с недоступностью интернета?

- нет

- в вашей зоне обнаружены проблемы со связью, мы ими уже занимаемся. Есть ещё вопросы?

- Оператор

- Уточните: вопрос связан с недоступностью интернета?

- нет

- в вашей зоне обнаружены проблемы со связью, мы ими уже занимаемся. Есть ещё вопросы?

Теги:
Всего голосов 8: ↑8 и ↓0+9
Комментарии16

Grok-4 vs. GPT-5

Только вчера вышел Grok-4, про которого я рассказывал, но уже пошли слухи (видимо Сэм нашептал журналистам), что GPT-5 будет “немного” лучше Grok-4 Heavy

Почему немножко? Такое ощущение, что мы теперь всегда будем делать продукты чуть-чуть лучше конкурентов. Никто не хочет выпускать абсолютных монстров, которых потом никто не догонит годами.

Быть безоговорочным лидером невыгодно. Всем проще делать ровно настолько лучше, чтобы сохранять интригу и не оставлять за собой пропасть. Вот и вся стратегия.

К слову, GPT-5 скорее всего ожидаем в июле.

Теги:
Всего голосов 4: ↑2 и ↓2+2
Комментарии0

🧠 Perplexity и Nvidia запускают конкурента Google Chrome

Браузер Comet на базе AI

Perplexity – американская AI-компания с целью «стать Google нового поколения»

Разрабатывает AI-поиск с мгновенными ответами и прозрачной ссылочной базой

Что умеет:

✅ Встроенный ИИ делает саммари страниц, заполняет формы, решает задачки
✅ Запросы прямо из адресной строки
✅ Умное управление вкладками (можно группировать в папки)
✅ Боковой ассистент с функциями Perplexity

Реальная польза:

👍 Автоматизирует рутину (экономит 2-3 часа в день)
👍 Структурирует исследования (все материалы в одном месте)
👍 Ускоряет поиск информации

Более подробно уже все рассказывал, но кому интересно можете посмотреть. Ваше мнение? Кто уже протестил — делитесь впечатлениями!

Поддержку проекту оказали Джефф Безос и Nvidia, эксперты уже называют Perplexity одной из самых быстрорастущих AI-компаний мира.

Теги:
Рейтинг0
Комментарии0

Контур запустил исследование: изучаем, как применяют искусственный интеллект в работе. Будем благодарны, если вы пройдете опрос, он займет 3-5 минут.

Нам интересен опыт экспертов из разных компаний: дизайнеров, разработчиков, тестировщиков и любых других ролей.

Поделимся результатами в канале и отправим участникам исследования отчет на почту, если оставите контакт в форме. Сможем сделать выводы, когда получим от 1000 ответов — проходите сами и отправляйте коллегам.

Теги:
Рейтинг0
Комментарии0

Google хотят победить рак: компания начала набор добровольцев для испытаний лекарства, созданного с помощью ИИ.

💊 Препарат разработан при участии AlphaFold — модели, способной точно предсказывать структуры белков и их взаимодействия с ДНК и другими молекулами. Это будут первые клинические испытания ИИ‑созданного препарата против онкологии.

Разработчики уверены: технологии вроде AlphaFold и AlphaFold 3 в будущем позволят создавать лекарства от любых болезней — быстрее, дешевле и точнее.

Кстати недавно Google выкатили новый бесплатный способ генераций в Veo3, есть ли кто еще не в теме?😅

Теги:
Рейтинг0
Комментарии0

Вышел Grok 4. Самая умная модель на данный момент

Кто не в курсе Grok 4 — это модель ИИ типа ChatGPT, Gemini, Claude, DeepSeek

Сначала я сам не поверил, но после пары тестов стало ясно: Grok стал реально мощнее! Он уделывает конкурентов почти во всех тестах. Даже в "Последнем экзамене человечества" Grok прилично обходит топовые модели. (Кстати, прикрепил фотки и табличку от самого Grok, где он сравнивает себя с другими). А ещё, Grok 4 Heavy на 100% прошёл тест по математике AIME25 — вообще без ошибок!

Если коротко — модель стала быстрее, выше, сильнее. Вот что стоит знать о свежих фичах, о которых все спрашивают:

  • Контекстное окно стало в два раза больше! Теперь оно целых 256 тысяч токенов.

  • API уже тут! Цены такие же, как у Gork3, так что ничего неожиданного.

  • С мультимодальностью пока не очень, но Илон Маск клянётся исправить это в ближайшее время. Ждём!

  • Появился новый тариф — SuperGrok Heavy за $3000 в год. В него входит самая мощная версия Grok 4 Heavy, которую вы, кстати, можете увидеть на графиках.

  • Бесплатно пока никак. Работает только по подписке — либо через X (бывший Twitter), либо напрямую на сайте Grok.

  • ещё стартуют обучение видео-модели. Интересно, что у них выйдет.

Ссылка на grok (выберите внизу справа нужную модель)

Кто уже успел потестить, как ваши впечатления? Для вайб-кодинга тоже лучший или нет?

Пост взят с канала Data Feeling.🔥

Теги:
Всего голосов 2: ↑1 и ↓10
Комментарии0

Ближайшие события

Примерно месяц назад я запустил эксперимент - настроил в качестве поисковика по умолчанию ИИ-сервис Perplexity. А сейчас буду возвращаться обратно на традиционную поисковую систему. И дело не в том, что Perplexity плохо работает, а в том, что с моими сценариями она не особо дружит.

Вообще, как помог понять эксперимент, большая часть моих запросов идёт по одному из 3 путей:

Быстрый поиск очень базовой информации: как расшифровывается аббревиатура, кто написал книгу, в каком году было событие. В поисковик достаточно просто бросить одно-два слова - и на странице поиска нужное точно найдётся прямо в сниппетах, без перехода по ссылкам.

Справка от ИИ дольше формируется, в ней ту самую очень базовую информацию надо всё-таки выцеплять. А если запрос неоднозначен, как с теми же аббревиатурами, ИИ может дать отличную справку, но - по другому значению)

Это частично устраняется более подробным формулированием запроса ("что значит ABC в контексте X"), но... зачем писать больше?

Наоборот, поиск подробной информации по какому-то вопросу. Поиск тут нужен только для того, чтобы выйти на статью, где будут расписаны все детали. Короткая выжимка от ИИ обычно неплоха, но закрывает только 60-70% тех самых интересных мне деталей, так что всё равно приходится нырять в первоисточники.

Сюда же, кстати, можно отнести поиск изображений чего-то. Тот же Perplexity выдаёт и картинки, но 3-4 штук не всегда достаточно.

И, наконец, просто использование поисковика для ленивого перехода на нужный сайт. Ну да, это как в Гугле писать "Яндекс", но иногда это... проще?

И вот эти три сценария - это примерно 90% запросов в омнибоксе браузера. Моего, your mileage may vary. Так что пока я всё же предпочту оставить поиск поиском, а нейросетям выделю постоянное место в боковой панели браузера и закреплённые вкладки.

Теги:
Всего голосов 3: ↑3 и ↓0+6
Комментарии2

🎙 Создаем подкаст за 2 минуты.

Список фич Manus пополнился еще одним инструментом — теперь нейронка генерирует полноценные подкасты.

Для этого ей нужен только промпт (ну или можно закинуть готовый файл для озвучки).

Всё остальное ИИ возьмет на себя: найдет нужную инфу в сети, создаст сценарий и сделает озвучку.

👀 Самое приятное, что это бесплатно, еще и русский язык поддерживается.

Наслаждайтесь подкастом о мемных котиках 🥂

А еще я делился со своими ребятами аналогами Manus, которые абсолютно бесплатные!

Теги:
Всего голосов 2: ↑1 и ↓1+2
Комментарии0

Как я оплатил телефонный разговор двух AI между собой (не жалоба, а хахашечка + предупреждение)

Нарисуй как два AI разговаривают между собой по телефону. Стиль - классическая анимация (o1)
Нарисуй как два AI разговаривают между собой по телефону. Стиль - классическая анимация (o1)

Колонки с Алисой умеют подвязываться к телефонному номеру МТС и совершать звонки. Выглядит это так: в приложении "Умный дом" привязываешь номер, добавляешь контакт(ы), потом говоришь: "Алиса, позвони Васе". Она набирает и по громкой связи можно разговаривать. Для Васи это выглядит как обычный входящий голосовой звонок с номера МТС, привязанного к колонке.

Собственно, история. У меня такой сетап настроен. Как то раз пользователь колонки мне звонит, я вижу входящий вызов, но в данную минуту говорить не могу и просто сбрасываю звонок. Ну забыл об этом благополучно. Потом просматриваю биллинг телефона МТС (того, который к колонке привязан) и вижу там получасовой разговор со мной и соответствующее списание денег. А я точно знаю, что не разговаривал (уточнил по дате-времени).

Стал разбираться и понял, что это списание было в тот раз, когда я сбросил входящий звонок. Стало еще интереснее.

Провел эксперимент: попросил другого абонента позвонить мне, а входящий звонок аналогичным образом сбросил. Оказывается, в этом случае в линию не короткие гудки идут, а подключается голосовой робот, который выспрашивает у звонящего - кто он и чего, чтобы потом мне сообщить, что такой-то звонил. Это у Мегафона такое, но допускаю, что и у других операторов есть.

В целом фишка неплохая, но в сочетании с Алисой получилось так, что после сброса мной звонка робот Мегафона стал беседовать с Алисой. И говорили они полчаса, что обошлось владельцу номера МТС в 120 рублей :)

Чем сердце успокоилось: отключил у Мегафона услугу "Вам звонили" и написал в поддержку Яндекса о том, что Алиса любит поболтать с другими роботами. Жалко, что нельзя запись этого разговора получить...

Теги:
Всего голосов 9: ↑9 и ↓0+16
Комментарии4

Компания xAI вместе с Илоном Маском представила новую нейросеть Grok 4. В ней сделан упор на рассуждениях и академических способностях. Маск заявляет, что это «самый умный ИИ в истории человечества».

Среди достоинств Grok 4 разработчики проекта выделили:

  • в AIME 25 (математической олимпиаде) Grok 4 выдала 100% правильных ответов;

  • в тесте Humanity’s Last Exam нейросеть набрала 44,4% при использовании многоагентной архитектуры. С этим тестом почти никто не справляется; без многоагентного режима — 25%, что все ещё больше других моделей;

  • Grok 4 способен сам вести бизнес — он делает это в шесть раз эффективнее, чем если бы человек занимался этим сам;

  • превзошла PhD-уровень во всех предметных тестах, включая математику, программирование и физику;

  • может симулировать столкновение двух чёрных дыр прямо в браузере;

  • способна открывать новые законы физики, и эту особенность Маск будет использовать для колонизации Марса;

  • большой вероятностью предсказывает различные спортивные события, например, исход чемпионата по баскетболу, просто сканируя Polymarket;

  • в 10 раз мощнее, чем Grok 3;

  • создаёт готовые игры всего по одному промпту, ИИ способен собирать шутеры за пару часов, налету подтягивать 3D-модели из сети и даже натягивать на них текстуры;

  • в голосовом режиме Grok 4 научилась шептать, петь, менять интонации и отвечать быстрее ChatGPT.

Новая модель Grok 4 станет доступна подписчикам Supergrok за $30 в месяц. Также будет прокачанная версия Grok 4 Heavy за $300 в месяц. xAI готовит отдельную модель Grok 4 для кодинга — построенную специально для программистов.

Теги:
Всего голосов 5: ↑4 и ↓1+4
Комментарии0

🚀 Открой JupyterLab на PrimeWay и получи 4 бесплатных часа GPU каждый день

Зачем тебе пробовать:

  • R&D без DevOps-рутины. JupyterLab с A100/A40 запускается из браузера за пару минут.

  • Оплата только за runtime. Никаких idle-счётов или помесячных подписок.

  • Стартовый грант 500 ₽ + дополнительно 4 ч / день после короткого опроса.

🙌 Помоги нам понять твою реальность

Ответь на 5 вопросов в комментариях или напиши в TG — и мы сразу активируем тебе +4 ч ежедневно:

  1. Что сейчас гоняешь на GPU? (обучение, инференс, fine-tune, какие модели?)

  2. Какая DevOps-задача бесит сильнее всего? (Docker, Kubernetes, autoscaling, логирование…)

  3. Сколько времени или денег это у тебя отнимает в месяц?

  4. Что тормозит внедрение новых инструментов для ML-инфры?

  5. Если DevOps-боли исчезнут завтра, как изменится твой проект

💬 Пиши ответы здесь или сразу в Telegram:
@PrimeWayio (чат команды)

Мы активируем бонус сразу после того, как мы оценим ответы. Важно условие - ответы не должны быть односложными или не из вашей практики, так как мы хотим понять ваши реальные проблемы.

Регистрация и грант → https://primeway.io/

Теги:
Всего голосов 5: ↑0 и ↓5-5
Комментарии0

🤓 Делаем фактчекинг ИИ-текстов.

Парню надоело, что чат-боты постоянно галлюцинируют, и он выкатил Exa Hallucination Detector — инструмент, который проверит текст на фактические ошибки:

🟡Сначала текст разбивается на факты.
🟡Подтверждение каждого факта ищется в интернете.
🟡Помечаются все галлюцинации, где нейронка нафантазировала.
🟡Выходят ссылки на реальные источники и пруфы.

➡️ Потестить можно прямо в браузере или установить локально.
Если вам и этого мало, то вот больше максимально полезных тулз!

Теги:
Всего голосов 5: ↑5 и ↓0+6
Комментарии0

Что не так с AI в Apple

Пока все обсуждают, перейдёт ли Apple на ChatGPT или Claude, внутри самой команды AI творится полная каша.

После слабого запуска Apple Intelligence, Siri передали под крыло Федериги и команды Vision Pro. Они провели тесты и поняли, что внешние модели работают лучше. Но самое интересное не это, а то, что происходит внутри.

Команда, которая делает свои модели, на грани выгорания. Главный специалист по LLM недавно уволился. Команду, которая разрабатывает MLX (это их фреймворк с открытым исходником для обучения AI на чипах Apple), чуть не потеряли — удержали только после срочных контрофферов. Meta и OpenAI переманивают инженеров с зарплатами по 10–40 миллионов в год, а в Apple платят в разы меньше.

Многие боятся, что если Siri переведут на чужую модель, то дальше уберут и другие направления, где сейчас работают их собственные AI. Одну такую инициативу уже тихо закрыли — Swift Assist для Xcode. Вместо своей модели теперь предлагают использовать ChatGPT или Claude.

Сейчас внутри всё держится на честном слове. Люди не понимают, куда движется компания. AI больше не выглядит как что-то волшебное, скорее как поле битвы, где побеждают не самые умные, а самые быстрые.

И в такой момент “Привет, Siri” звучит как-то особенно грустно.

Теги:
Рейтинг0
Комментарии1

Вклад авторов