News / Profile of runaway_llm / Habr

Андрей Пешков @runaway_llm

User

ProfileArticles18PostsNews287Comments83

runaway_llm Aug 21 at 10:13

DeepSeek V3.1 выпущен официально. Дешевая модель с улучшенными агентскими функциями

1 min

7.5K

Artificial IntelligenceMachine learning *

В X‑аккаунте DeepSeek опубликован подробный анонс новой модели V3.1 на английском языке — сама модель доступна уже два дня. Разработчики называют обновленную модель «первым шагом в эру агентов», что подтверждается бенчмарками.

Читать далее

+6

runaway_llm Aug 21 at 07:47

Чаты пользователей с Grok утекли в сеть — речь идет о 370 тысячах диалогов

1 min

2.4K

Artificial IntelligenceMachine learning *

Forbes пишет, что переписки с чат-ботом Grok, которыми пользователи делились друг с другом, попали в индекс поисковых систем. Например, в Google можно найти более 370 тысяч диалогов на разные темы: от простых задач написания твитов до попыток взлома криптокошелька. Журналисты Forbes сообщают, что в некоторых переписках можно найти персональную информацию: имена и фамилии, а в одном изученном случае — даже пароль от аккаунта. Также доступны файлы, которые пользователь загружал в ходе диалога — фото, документы и таблицы.

Читать далее

+2

runaway_llm Aug 20 at 23:52

GPT-5 обошел другие ИИ в пространственном мышлении. Но до людей еще далеко

2 min

1.3K

Artificial IntelligenceMachine learning *

Специалисты SenseTime Research и S-Lab (NTU) в свежем исследовании проанализировали способности GPT-5 к пространственному мышлению, сравнив их с человеческим навыком и другими ИИ — Gemini 2.5 Pro, Qwen 2.5 и InternVL3.

Читать далее

+2

runaway_llm Aug 20 at 18:35

На презентации Google Pixel 10 показали новые ИИ-функции для Android и iOS

1 min

2.7K

Artificial IntelligenceMachine learning *

Google только что представила новый смартфон Pixel 10, который поступит в продажу 28 августа. В ходе презентации также был анонсирован набор ИИ‑функций на базе Gemini — как эксклюзивных для смартфона, так и доступных для всех устройств под управлением Android и iOS. Эксклюзивом Pixel 10 станет Voice translate — функция перевода звонков в реальном времени. Она работает на «железе» смартфона, поэтому данные не отправляются на внешние серверы. Это повышает уровень безопасности.

Читать далее

+4

runaway_llm Aug 20 at 14:31

Каким получился обновленный DeepSeek — скорость и дешевизна вместо бенчмарков

1 min

14K

Machine learning * Artificial Intelligence

Известный китайский ИИ DeepSeek получил обновление до версии V3.1 и уже доступен на сайте, в мобильных приложениях и для загрузки с Huggingface. Апдейт прошел тихо: до сих пор не опубликована карточка модели и официальные результаты бенчмарков. Но уже появилось достаточно много сторонних тестов, из которых понятно, что команда в этот раз сосредоточилась на оптимизации модели, а рекорды в бенчмарках отложила на потом.

Читать далее

+2

runaway_llm Aug 20 at 10:45

Новая версия Grok доступна бесплатно в Cursor

1 min

5.1K

Artificial IntelligenceMachine learning *

"Секретная" модель Sonic доступна бесплатно для тестирования в редакторе кода Cursor и расширении Cline. Разработчик Sonic официально не раскрывается, но если спросить саму модель, кто ее создал, то она представляется как "Grok от xAI". Выбрать Sonic можно в селекторе моделей в приложении Cursor — а вот в веб-версии данная модель отсутствует.

Читать далее

+4

runaway_llm Aug 19 at 16:42

Сэм Альтман рассказал о GPT-6

1 min

22K

Machine learning * Artificial Intelligence

Глава OpenAI Сэм Альтман в эфире передачи AI Effect на телеканале CNBC раскрыл свое видение GPT-6. По его словам, фокус в "шестерке" будет сделан на долговременной памяти. Похожая функция уже есть в ChatGPT, но GPT-6 будет фактически "знать" пользователя, подстраиваясь под него в самых мелочах. По словам Альтмана, OpenAI активно работает с психологами, чтобы сделать ИИ настоящим партнером.

Читать далее

+5

runaway_llm Aug 19 at 13:37

DeepSeek получил обновление. К сожалению, пока не до R2

1 min

10K

Artificial IntelligenceMachine learning *

В китайском аккаунте DeepSeek опубликована короткая новость о запуске DeepSeek V3.1 — обновленной "быстрой" модели. Опробовать ее уже можно в веб-версии, приложении и по API.

Читать далее

+10

runaway_llm Aug 19 at 11:39

ChatGPT в одиночку занимает почти 50% веб-трафика ИИ

1 min

1.5K

Artificial IntelligenceMachine learning *

Согласно проведенному onelittleweb исследованию The Big Bang of AI Chatbots, годовой показатель визитов веб-версии ChatGPT вырос на 106% и достиг 46,59 миллиардов — это 48,36% от визитов на все ИИ-инструменты, присутствующие в онлайне. Количество ежемесячных визитов оценивается в 5 миллиардов, а средняя длительность сессии — в 15 минут и 25 секунд.

Читать далее

+2

runaway_llm Aug 18 at 23:09

Читатели в среднем не отличили ИИ-рассказы от текстов профессиональных писателей

1 min

1.5K

Machine learning * Artificial Intelligence

Марк Лоуренс подвел итоги своего второго эксперимента по сравнению коротких фэнтези-рассказов, написанных профессиональными писателями и ИИ. По одному рассказу для эксперимента написали Джанни Вуртс, Робин Хобб, Майлз Кэмерон и сам Лоуренс — все они известные авторы фэнтези с суммарным тиражом книг около 15 миллионов. Еще четыре текста были сгенерированы GPT-5: для каждой попытки Лоуренс менял промпт, чтобы рассказы не получились похожими. Затем Лоуренс попросил посетителей своего блога прочесть рассказы, попробовать угадать авторство (ИИ или человек), а также выставить рейтинг каждому рассказу.

Читать далее

+1

runaway_llm Aug 18 at 17:10

ИИ nano banana задает новый стандарт в создании картинок. Но кто его разработчик?

1 min

9.8K

Artificial IntelligenceMachine learning *

На LMArena уже несколько дней можно протестировать секретную модель создания графики под кодовым именем nano banana. Для этого надо или дождаться, когда доступ к модели "выпадет" случайным образом, или загрузить собственную картинку для редактирования — так шансы получить доступ возрастают. Тестировщики отмечают, что nano banana отлично рисует графику с нуля и редактирует изображения.

Читать далее

+2

runaway_llm Aug 18 at 13:43

Пользователь Claude Max израсходовал $50 тыс на подписке за $200 и «подставил» других подписчиков

1 min

14K

Machine learning * Artificial Intelligence

На китайском форуме опубликован рассказ пользователя (ссылка на Reddit с пересказом), который утверждает, что именно его действия являются причиной ужесточения лимитов на Claude AI для подписчиков Pro и Max. Напомню, что некоторое время назад Anthropic анонсировала введение дополнительных еженедельных лимитов из-за того, что некоторые пользователи используют Claude Code практически круглосуточно — на 200-долларовом плане они расходуют токенов на десятки тысяч долларов в пересчете на API-цены.

Читать далее

-8

runaway_llm Aug 18 at 09:04

GPT-5 Pro стала лидером по IQ среди ИИ. «Средний» человек позади (но с оговорками)

2 min

6.5K

Artificial IntelligenceMachine learning *

Tracking AI представил обновленный рейтинг ИИ в тесте на IQ. Первые два места в нем заняли две версии GPT-5 Pro (со выключенным и включенным компьютерным зрением), следом расположились Gemini 2.5 Pro, Claude Opus 4 и Grok 4.

Читать далее

+3

runaway_llm Aug 17 at 20:51

DeepSeek-R1 провалил проверку на здравый смысл в новом бенчмарке

2 min

4.8K

Artificial IntelligenceMachine learning *

Семейство бенчмарков EQ-Bench пополнилось новым тестом, в котором популярные ИИ оцениваются на подхалимство и подкрепление бреда. Худший общий результат в бенчмарке показал DeepSeek-R1, дальше идут Claude Sonnet 4 и GPT-4o.

Читать далее

-3

runaway_llm Aug 17 at 10:43

OpenAI готова приобрести Google Chrome. А параллельно занимается своим браузером

1 min

4.6K

Machine learning * Artificial Intelligence

На недавнем ужине с журналистами глава OpenAI Сэм Альтман подтвердил готовность компании купить Chrome у Google в том случае, если его придется выставить на продажу. Ранее ИИ-стартап Perplexity предложил за браузер сумму в $34,5 млрд, также покупкой интересовались Search.com и Yahoo.

Читать далее

+2

runaway_llm Aug 16 at 14:57

ИИ Claude сможет завершать беседу в ответ на хамство пользователя

2 min

2.2K

Artificial IntelligenceMachine learning *

В Anthropic сообщили, что дали своим моделям Claude Opus 4 / 4.1 возможность прекращать диалог в редких случаях, когда пользователь продолжительное время оскорбляет модель или общается с ней некорректно. В такой ситуации Claude выведет сообщение о завершении беседы, а вместо поля для набора текста пользователь сможет начать новый чат, отправить обратную связь разработчикам или отредактировать свои прошлые сообщения и перезапустить диалог.

Читать далее

+4

runaway_llm Aug 16 at 13:23

Чат-версия GPT-5 уступила GPT-4o в обновленном рейтинге Lmarena

1 min

5.9K

Artificial IntelligenceMachine learning *

Сайт Lmarena обновил свой рейтинг языковых моделей, отдельно показав разные версии GPT-5. Данный рейтинг интересен тем, что составляется при помощи пользователей, которые задают вопрос и получают два анонимных ответа от разных моделей, выбирая из них лучший.

Читать далее

+4

runaway_llm Aug 15 at 18:50

Демис Хассабис считает игры одним из лучших тестов для ИИ

2 min

1K

Machine learning * Artificial Intelligence

В разговоре с Логаном Килпатриком глава Google DeepMind Демис Хассабис заявил, что считает игры одним из самых перспективных бенчмарков для ИИ. Хассабис отметил, что многие существующие тесты, вроде SAT (стандартизированный тест для поступления в колледжи), GRE (тест для аспирантуры) и MMLU (многоуровневый тест на понимание языка), уже почти «пройдены» ИИ. При этом современные модели показывают «неровный интеллект»: получают золотые медали на Международной математической олимпиаде (IMO), но совершают элементарные ошибки в простых логических задачах или специально сформулированных играх. Это указывает на отсутствие у моделей ключевых навыков, таких как рассуждение, планирование и память, которые необходимы для достижения настоящего общего искусственного интеллекта.

Читать далее

+2

runaway_llm Aug 15 at 15:46

Сэм Альтман о запуске GPT-5: «мы облажались с некоторыми вещами»

1 min

9.3K

Artificial IntelligenceMachine learning *

По информации Bloomberg, глава OpenAI Сэм Альтман признал, что запуск GPT-5 прошел намного хуже, чем планировали в компании. "Думаю, мы полностью облажались с некоторыми вещами в процессе запуска" — заявил Альтман в разговоре с журналистами в четверг.

Читать далее

+6

runaway_llm Aug 15 at 08:40

Google представила Gemma3 270M — ИИ, который идет даже на смартфоне

1 min

4.5K

Artificial IntelligenceMachine learning *

Вышла Gemma 3 270M — самая маленькая в семействе открытых моделей Gemma 3, заточенная под узкие задачи и дообучение. Новинка открытая и уже доступна на Hugging Face. Для Gemma 3 270M доступны QAT-чекпойнты, позволяющие уверенно запускать модель в INT4 с минимальной потерей качества — это важно для работы на маломощных устройствах.

Читать далее

+11

1 2 ...

9

10 11 ...