All streams
Search
Write a publication
Pull to refresh
25
97.6
Андрей Пешков @runaway_llm

User

Send message

GPT-5 раскритиковали за неудачный запуск

Reading time2 min
Views37K

Вчера OpenAI выпустила GPT-5 — свою самую мощную и передовую модель. Но несмотря на впечатляющие результаты в бенчмарках, сам запуск проходит с серьезными проблемами. При написании этой новости я основывался на тексте известного инсайдера Тибора Блахо, данных из некоторых других X-аккаунтов и личном опыте.

Читать далее

Вышла GPT-5 — базовая версия будет доступна бесплатно

Reading time2 min
Views21K

OpenAI представила свою новую флагманскую модель — GPT-5, которая с сегодняшнего дня будет доступна на большинстве тарифных планов, в том числе бесплатном. С выходом новинки пользователям больше не нужно выбирать между рассуждающим или быстрым ИИ — GPT-5 будет сама определять сложность вопроса и выбирать бюджет рассуждений.

Если говорить о бенчмарках, то в первую очередь бросается уровень галлюцинаций — по заявлениям OpenAI, он значительно снизился в сравнении с GPT o3.

Читать далее

Разные версии GPT-5 раскрыты в утечке GitHub

Reading time1 min
Views8K

На сайте GitHub раньше времени опубликовали новость о добавлении GPT-5 на сервис. Новость удалена, но доступна в архиве, а главное в ней — описание разных версий модели.

Читать далее

GPT-5 представят 7 августа в 20:00 — OpenAI

Reading time1 min
Views11K

Компания OpenAI анонсировала стрим на своем канале в четверг в 20:00 по Москве. Из написания текста (5 вместо S) очевидно, что речь идет об анонсе GPT-5. Ранее в API OpenAI были замечены иконки моделей, подтверждающие озвученные ранее слухи о трех версиях — GPT-5, GPT-5-mini и GPT-5-nano.

Читать далее

Выпущен Claude Opus 4.1 — модель стала еще лучше в программировании

Reading time1 min
Views11K

Anthropic представила Claude Opus 4.1 — улучшенную версию своей модели, которая показывает прирост в множестве основных бенчмарков. Вот результаты, в первую очередь разработчики обращают внимание на 74.5% в SWE-bench Verified:

Читать далее

OpenAI выпустила модель с открытыми весами, которая почти не уступает o3

Reading time1 min
Views6.9K

Впервые с GPT-2 OpenAI выпустила open source модель под названием GPT-OSS. Модель распространяется по лицензии Apache 2.0. В семействе модели на 21B и 117B параметров, при этом используется архитектура "экспертов", когда запускаются только те части модели, которые действительно нужны для ответа на вопрос. Благодаря этому, младшая версия идет на видеокартах с 16 ГБ памяти, а "старшей" требуется профессиональный ускоритель с 80 ГБ.

Читать далее

Google представила Genie 3 — модель мира с впечатляющими характеристиками

Reading time2 min
Views13K

Genie 3 является развитием вышедших в прошлом году Genie и Genie 2, а также использует технологии, представленные в Veo 3 — например, достоверную симуляцию физики. Модель умеет генерировать виртуальные миры в разрешении 720p с 24 кадрами в секунду, по которым пользователь может перемещаться с помощью стрелок. Важное качество для таких моделей — стабильность сцены, так как ИИ могут "забывать" про существование каких-то предметов или, например, менять их внешний мир. Если в Genie 2 этот показатель равнялся 10-20 секундам, то в новой версии Google обещает несколько минут.

Читать далее

Работу модуля OpenAI для борьбы с «галлюцинациями» описали в деталях

Reading time2 min
Views5.4K

Издание The Information, ранне рассказавшее о том, что в GPT-5 применили модуль Universal Verifier для борьбы с "галлюцинациями", опубликовало отдельную статью с подробностями этой системы. Фактически речь идет об отдельной специализированной нейросети, которая используется во время обучения с подкреплением, проверяя каждый ответ модели и выставляя им баллы. При низком балле проверяемая модель генерирует ответ заново.

Читать далее

Руководитель СhatGPT анонсировал рекорд приложения, намекнув на выход GPT-5 в ближайшие дни

Reading time1 min
Views13K

TechCrunch со ссылкой на руководителя приложения ChatGPT Ника Терли сообщает, что аудитория сервиса на этой неделе превысит 700 миллионов пользователей в неделю. Обращает на себя внимание странная формулировка — обычно о достижении метрик сообщают по факту, а не заранее. Вероятно, таким таким образом Ник намекает на скорый запуск GPT-5.

Читать далее

«Кнут и пряник» для ИИ не работает: исследование рушит миф о «трюках» в промптах

Reading time2 min
Views2K

Специалисты из Пенсильванского университета и Уортонской школы бизнеса опубликовали исследование, показывающее, что шантаж, задабривание и другие попытки манипулировать в промптах никак не повышают результативность современных ИИ. Исследование провели на моделях Gemini 1.5 Flash, Gemini 2.0 Flash, GPT-4o, GPT-4o-mini и GPT o4-mini. Всем ИИ задавали два набора вопросов: GPQA (PhD-уровень естественных наук) и MMLU-Pro (инженерные дисциплины), при этом каждый вопрос задавался 25 раз при температуре 1.0 — это делалось чтобы избежать случайных колебаний ответов.

Читать далее

Глава OpenAI пообещал «множество запусков» в следующие два месяца

Reading time1 min
Views5.1K

Руководитель OpenAI опубликовал в X пост следующего содержания: "У нас запланирована куча запусков в ближайшие пару месяцев — новые модели, продукты, функции и многое другое. Пожалуйста, проявите терпение: возможны некоторые сбои и перегрузки по мощности. Хотя все может идти немного неровно, мы уверены, что вам действительно понравится то, что мы для вас подготовили!"

Читать далее

В Anthropic выяснили, как ИИ вырабатывает те или иные черты характера

Reading time2 min
Views5.6K

В Anthropic провели исследование, в ходе которого выяснили, почему ИИ иногда обретает определенные персональные черты, в том числе нежелательные — например, озлобленность, подхалимство или склонность к галлюцинациям. Исследователи взяли "нормальные" ответы и ответы, в которых ИИ проявлял одну из перечисленных выше особенностей, а затем вычли активации нейронов, получив так называемый persona vector. Чем сильнее активации "смотрят" в направлении вектора — тем больше проявляется черта, с которой он связан.

Читать далее

Сотрудники OpenAI использовали ИИ Claude для программирования. В Anthropic уже закрыли доступ

Reading time1 min
Views28K

WIRED сообщает, что во вторник Anthropic закрыла доступ к Claude Code для сотрудников OpenAI, проинформировав компанию о нарушении правил пользования сервисом. "Claude Code стал выбором номер один для программистов по всему миру, поэтому нет ничего удивительного в том, что даже технические специалисты OpenAI использовали наши инструменты для программирования перед запуском GPT-5", — заявил представитель Anthropic Кристофер Налти в комментарии для WIRED.

Читать далее

GPT-5 получит модуль для борьбы с «галлюцинациями» — The Information

Reading time2 min
Views12K

Издание The Information опубликовало большую статью о разработке GPT-5, в которой раскрыло и некоторые технические особенности ожидаемой модели OpenAI. Новинка будет основана на технологии обучения с подкреплением, к которой добавили Universal Verifier — специальный модуль, проверяющий каждый ответ перед его отправкой пользователю. Ожидается, что этот модуль значительно снизит количество галлюцинаций.

Читать далее

Лучше GPT o3 и Grok 4. Google выпустила Gemini 2.5 Deep Think

Reading time1 min
Views5.5K

Компания Google сообщила о выпуске Gemini 2.5 Pro Deep Think - своей самой мощной языковой модели, которая ранее взяла золотую медаль Международной математической олимпиады 2025 (IMO 2025). Новинка будет доступна подписчикам плана Gemini Ultra, который стоит 250 долларов в месяц. Также компания предоставила доступ к модели группе математиков, а в ближайшее время планирует начать тестирование версии для API.

Читать далее

OpenAI отключила возможность индексации чатов с ChatGPT в Google

Reading time1 min
Views1.5K

Дейн Стаки, ведущий инженер по безопасности в OpenAI, написал в своем X, что компания приняла решение отключить функцию, которая позволяла пользователям открывать чаты для индексации Google и другими поисковыми системами. Он отдельно указал на то, что это был специальный чекбокс при создании ссылки на сайте — включив его, пользователь делал чат открытым для поиска.

Читать далее

Создатель Claude AI назвал AGI и «сверхинтеллект» маркетинговыми клише

Reading time1 min
Views5.4K

Глава Anthropic и создатель Claude AI Дарио Амодеи на подкасте Алекса Кантровица покритиковал своих коллег, которые постоянно говорят о том, как достигнут AGI и переключатся на суперинтеллект. Сам Амодеи считает эти термины просто маркетинговыми клише: "Я не знаю, что такое AGI. Я не знаю, что такое суперинтеллект. Это звучит как маркетинговый термин. Да, это звучит, знаете, как что-то, созданное, чтобы активировать дофамин у людей".

Читать далее

Как ИИ OpenAI взял «золото» Международной математической олимпиады

Reading time2 min
Views5.2K

На YouTube-канале Sequoia Capital опубликовано интервью с разработчиками экспериментальной модели OpenAI, показавшей результат уровня "золота" Международной математической олимпиады 2025 года (IMO 2025). Идея родилась 6 месяцев назад, а занималась ей команда из трех специалистов - Алекса Вэй, Ноама Брауна и Шерил Сюй. Они поставили перед собой цель не тренировать ИИ конкретно под задачи IMO 2025, а создать модель общего назначения. Одним из ключевых приемов стала система агентов, параллельно работающих над задачей — подробности в OpenAI держат в секрете, но планируют внедрить в будущих коммерческих моделях.

Читать далее

Google добавила ИИ-видеопересказы в NotebookLM

Reading time1 min
Views1.4K

В инструменте для быстрого анализа контента NotebookLM появилась функция создания видеопересказов. Она работает по стандартной для сервиса схеме. Сначала пользователь загружает в NotebookLM максимум информации по интересующей его теме: это могут быть онлайн-статьи, документы, презентации, ссылки на Youtube-видео и так далее. Далее NotebookLM использует модель Gemini 2.5 Flash для написания текстовой сводки, а также дальнейшей обработки информации: создания FAQ, хронологии, подкаста с двумя ведущими, ментальной карты, а теперь и видеопересказа.

Читать далее

Information

Rating
74-th
Registered
Activity

Specialization

Content Director
Lead
Project management
Planning
Strategic planning
Building a team
Budgeting projects
Organization of business processes