All streams
Search
Write a publication
Pull to refresh
25
92.8
Андрей Пешков @runaway_llm

User

Send message

DeepSeek V3.1 выпущен официально. Дешевая модель с улучшенными агентскими функциями

Reading time1 min
Views7.5K

В X‑аккаунте DeepSeek опубликован подробный анонс новой модели V3.1 на английском языке — сама модель доступна уже два дня. Разработчики называют обновленную модель «первым шагом в эру агентов», что подтверждается бенчмарками.

Читать далее

Чаты пользователей с Grok утекли в сеть — речь идет о 370 тысячах диалогов

Reading time1 min
Views2.4K

Forbes пишет, что переписки с чат-ботом Grok, которыми пользователи делились друг с другом, попали в индекс поисковых систем. Например, в Google можно найти более 370 тысяч диалогов на разные темы: от простых задач написания твитов до попыток взлома криптокошелька. Журналисты Forbes сообщают, что в некоторых переписках можно найти персональную информацию: имена и фамилии, а в одном изученном случае — даже пароль от аккаунта. Также доступны файлы, которые пользователь загружал в ходе диалога — фото, документы и таблицы.

Читать далее

GPT-5 обошел другие ИИ в пространственном мышлении. Но до людей еще далеко

Reading time2 min
Views1.3K

Специалисты SenseTime Research и S-Lab (NTU) в свежем исследовании проанализировали способности GPT-5 к пространственному мышлению, сравнив их с человеческим навыком и другими ИИ — Gemini 2.5 Pro, Qwen 2.5 и InternVL3.

Читать далее

На презентации Google Pixel 10 показали новые ИИ-функции для Android и iOS

Reading time1 min
Views2.7K

Google только что представила новый смартфон Pixel 10, который поступит в продажу 28 августа. В ходе презентации также был анонсирован набор ИИ‑функций на базе Gemini — как эксклюзивных для смартфона, так и доступных для всех устройств под управлением Android и iOS. Эксклюзивом Pixel 10 станет Voice translate — функция перевода звонков в реальном времени. Она работает на «железе» смартфона, поэтому данные не отправляются на внешние серверы. Это повышает уровень безопасности.

Читать далее

Каким получился обновленный DeepSeek — скорость и дешевизна вместо бенчмарков

Reading time1 min
Views14K

Известный китайский ИИ DeepSeek получил обновление до версии V3.1 и уже доступен на сайте, в мобильных приложениях и для загрузки с Huggingface. Апдейт прошел тихо: до сих пор не опубликована карточка модели и официальные результаты бенчмарков. Но уже появилось достаточно много сторонних тестов, из которых понятно, что команда в этот раз сосредоточилась на оптимизации модели, а рекорды в бенчмарках отложила на потом.

Читать далее

Новая версия Grok доступна бесплатно в Cursor

Reading time1 min
Views5.1K

"Секретная" модель Sonic доступна бесплатно для тестирования в редакторе кода Cursor и расширении Cline. Разработчик Sonic официально не раскрывается, но если спросить саму модель, кто ее создал, то она представляется как "Grok от xAI". Выбрать Sonic можно в селекторе моделей в приложении Cursor — а вот в веб-версии данная модель отсутствует.

Читать далее

Сэм Альтман рассказал о GPT-6

Reading time1 min
Views22K

Глава OpenAI Сэм Альтман в эфире передачи AI Effect на телеканале CNBC раскрыл свое видение GPT-6. По его словам, фокус в "шестерке" будет сделан на долговременной памяти. Похожая функция уже есть в ChatGPT, но GPT-6 будет фактически "знать" пользователя, подстраиваясь под него в самых мелочах. По словам Альтмана, OpenAI активно работает с психологами, чтобы сделать ИИ настоящим партнером.

Читать далее

DeepSeek получил обновление. К сожалению, пока не до R2

Reading time1 min
Views10K

В китайском аккаунте DeepSeek опубликована короткая новость о запуске DeepSeek V3.1 — обновленной "быстрой" модели. Опробовать ее уже можно в веб-версии, приложении и по API.

Читать далее

ChatGPT в одиночку занимает почти 50% веб-трафика ИИ

Reading time1 min
Views1.5K

Согласно проведенному onelittleweb исследованию The Big Bang of AI Chatbots, годовой показатель визитов веб-версии ChatGPT вырос на 106% и достиг 46,59 миллиардов — это 48,36% от визитов на все ИИ-инструменты, присутствующие в онлайне. Количество ежемесячных визитов оценивается в 5 миллиардов, а средняя длительность сессии — в 15 минут и 25 секунд.

Читать далее

Читатели в среднем не отличили ИИ-рассказы от текстов профессиональных писателей

Reading time1 min
Views1.5K

Марк Лоуренс подвел итоги своего второго эксперимента по сравнению коротких фэнтези-рассказов, написанных профессиональными писателями и ИИ. По одному рассказу для эксперимента написали Джанни Вуртс, Робин Хобб, Майлз Кэмерон и сам Лоуренс — все они известные авторы фэнтези с суммарным тиражом книг около 15 миллионов. Еще четыре текста были сгенерированы GPT-5: для каждой попытки Лоуренс менял промпт, чтобы рассказы не получились похожими. Затем Лоуренс попросил посетителей своего блога прочесть рассказы, попробовать угадать авторство (ИИ или человек), а также выставить рейтинг каждому рассказу.

Читать далее

ИИ nano banana задает новый стандарт в создании картинок. Но кто его разработчик?

Reading time1 min
Views9.8K

На LMArena уже несколько дней можно протестировать секретную модель создания графики под кодовым именем nano banana. Для этого надо или дождаться, когда доступ к модели "выпадет" случайным образом, или загрузить собственную картинку для редактирования — так шансы получить доступ возрастают. Тестировщики отмечают, что nano banana отлично рисует графику с нуля и редактирует изображения.

Читать далее

Пользователь Claude Max израсходовал $50 тыс на подписке за $200 и «подставил» других подписчиков

Reading time1 min
Views14K

На китайском форуме опубликован рассказ пользователя (ссылка на Reddit с пересказом), который утверждает, что именно его действия являются причиной ужесточения лимитов на Claude AI для подписчиков Pro и Max. Напомню, что некоторое время назад Anthropic анонсировала введение дополнительных еженедельных лимитов из-за того, что некоторые пользователи используют Claude Code практически круглосуточно — на 200-долларовом плане они расходуют токенов на десятки тысяч долларов в пересчете на API-цены.

Читать далее

GPT-5 Pro стала лидером по IQ среди ИИ. «Средний» человек позади (но с оговорками)

Reading time2 min
Views6.5K

Tracking AI представил обновленный рейтинг ИИ в тесте на IQ. Первые два места в нем заняли две версии GPT-5 Pro (со выключенным и включенным компьютерным зрением), следом расположились Gemini 2.5 Pro, Claude Opus 4 и Grok 4.

Читать далее

DeepSeek-R1 провалил проверку на здравый смысл в новом бенчмарке

Reading time2 min
Views4.8K

Семейство бенчмарков EQ-Bench пополнилось новым тестом, в котором популярные ИИ оцениваются на подхалимство и подкрепление бреда. Худший общий результат в бенчмарке показал DeepSeek-R1, дальше идут Claude Sonnet 4 и GPT-4o.

Читать далее

OpenAI готова приобрести Google Chrome. А параллельно занимается своим браузером

Reading time1 min
Views4.6K

На недавнем ужине с журналистами глава OpenAI Сэм Альтман подтвердил готовность компании купить Chrome у Google в том случае, если его придется выставить на продажу. Ранее ИИ-стартап Perplexity предложил за браузер сумму в $34,5 млрд, также покупкой интересовались Search.com и Yahoo.

Читать далее

ИИ Claude сможет завершать беседу в ответ на хамство пользователя

Reading time2 min
Views2.2K

В Anthropic сообщили, что дали своим моделям Claude Opus 4 / 4.1 возможность прекращать диалог в редких случаях, когда пользователь продолжительное время оскорбляет модель или общается с ней некорректно. В такой ситуации Claude выведет сообщение о завершении беседы, а вместо поля для набора текста пользователь сможет начать новый чат, отправить обратную связь разработчикам или отредактировать свои прошлые сообщения и перезапустить диалог.

Читать далее

Чат-версия GPT-5 уступила GPT-4o в обновленном рейтинге Lmarena

Reading time1 min
Views5.9K

Сайт Lmarena обновил свой рейтинг языковых моделей, отдельно показав разные версии GPT-5. Данный рейтинг интересен тем, что составляется при помощи пользователей, которые задают вопрос и получают два анонимных ответа от разных моделей, выбирая из них лучший.

Читать далее

Демис Хассабис считает игры одним из лучших тестов для ИИ

Reading time2 min
Views1K

В разговоре с Логаном Килпатриком глава Google DeepMind Демис Хассабис заявил, что считает игры одним из самых перспективных бенчмарков для ИИ. Хассабис отметил, что многие существующие тесты, вроде SAT (стандартизированный тест для поступления в колледжи), GRE (тест для аспирантуры) и MMLU (многоуровневый тест на понимание языка), уже почти «пройдены» ИИ. При этом современные модели показывают «неровный интеллект»: получают золотые медали на Международной математической олимпиаде (IMO), но совершают элементарные ошибки в простых логических задачах или специально сформулированных играх. Это указывает на отсутствие у моделей ключевых навыков, таких как рассуждение, планирование и память, которые необходимы для достижения настоящего общего искусственного интеллекта.

Читать далее

Сэм Альтман о запуске GPT-5: «мы облажались с некоторыми вещами»

Reading time1 min
Views9.3K

По информации Bloomberg, глава OpenAI Сэм Альтман признал, что запуск GPT-5 прошел намного хуже, чем планировали в компании. "Думаю, мы полностью облажались с некоторыми вещами в процессе запуска" — заявил Альтман в разговоре с журналистами в четверг.

Читать далее

Google представила Gemma3 270M — ИИ, который идет даже на смартфоне

Reading time1 min
Views4.5K

Вышла Gemma 3 270M — самая маленькая в семействе открытых моделей Gemma 3, заточенная под узкие задачи и дообучение. Новинка открытая и уже доступна на Hugging Face. Для Gemma 3 270M доступны QAT-чекпойнты, позволяющие уверенно запускать модель в INT4 с минимальной потерей качества — это важно для работы на маломощных устройствах.

Читать далее

Information

Rating
77-th
Registered
Activity

Specialization

Content Director
Lead
Project management
Planning
Strategic planning
Building a team
Budgeting projects
Organization of business processes