Хабр

Все потоки

СтатьиПостыНовостиАвторыКомпании

DashaPasha 24 июл в 14:42

Отчет Google AI & Economy ATLAS: ИИ уже в 68% профессий, но пока только в 21% задач

Простой

5 мин

7K

Блог компании BotHubИскусственный интеллектИсследования и прогнозы в IT * Машинное обучение *

Аналитика

Google опубликовала выпуск AI & Economy ATLAS — исследование о том, как люди используют ИИ в работе и повседневной жизни. ИИ уже присутствует в широком спектре профессий, но чаще помогает с отдельными задачами, чем заменяет их целиком. Разбираемся, почему так и разбираем особенно интересные моменты отчета.

Читать далее

0

Irvin_Nivri 24 июл в 07:08

Большой разбор Physical AI: VLA-модели, гуманоиды, гонка Китая и США и что есть у России. Часть 1

20 мин

7.7K

Блог компании BotHubИскусственный интеллектНаучно-популярное

Обзор

Сколько времени вам нужно, чтобы сложить футболку? Секунды три, если аккуратно. Пять, если совсем аккуратно.

А теперь другой вопрос. Как вы думаете, сколько лет понадобилось мировой робототехнике, чтобы машина сложила ту же футболку сама — без жестко прописанной программы, без специальной оснастки, просто взяв мятую тряпку из корзины?

Отвечаю: примерно шестьдесят. Первый промышленный робот встал на конвейер General Motors в 1961 году, а уверенно складывающего белье робота впервые показали осенью 2024-го. И это, честно говоря, было событием покрупнее многих громких презентаций.

Читать далее

+15

DashaPasha 21 июл в 19:47

WAIC 2026: главные анонсы и почему Китай превращает искусственный интеллект в национальную инфраструктуру

Средний

19 мин

13K

Блог компании BotHubИскусственный интеллектИсследования и прогнозы в IT *

Дайджест

Мировой ИИ-ландшафт окончательно разделился на две параллельные экосистемы. Прошедшая в Шанхае конференция World Artificial Intelligence Conference (WAIC) 2026 зафиксировала фундаментальный сдвиг: индустрия завершила экстенсивную гонку параметров языковых моделей и перешла к этапу жесткой инженерной прагматики.

Пока западные корпорации выстраивают закрытые монополии вокруг проприетарных API, Китай делает ставку на агрессивный open source, агентные операционные системы и суверенные вычислительные кластеры, способные масштабироваться до сотен тысяч ускорителей в условиях санкционных ограничений. В этом материале мы детально разбираем аппаратные и программные итоги выставки — от альтернативных интерконнектов Huawei до VLA-моделей в промышленной робототехнике — и объясняем, почему главным продуктом WAIC 2026 стала не очередная нейросеть, а полностью независимый национальный технологический стек.

Читать далее

+15

Irvin_Nivri 20 июл в 10:06

Тест Тьюринга для Fable 5. Сможет ли флагманская модель Anthropic прикинуться человеком?

Средний

46 мин

8.2K

Блог компании BotHubИскусственный интеллектНаучно-популярное

Обзор

Про тест Тьюринга слышали все, и почти все представляют его как какой-то экзамен: есть машина, есть список вопросов, машина отвечает — и либо проходит, либо нет. Так вот, ничего этого не существует. Ни списка, ни методики, ни проходного балла.

Тест Тьюринга — это концепция из статьи «Computing Machinery and Intelligence», которую Алан Тьюринг опубликовал в 1950 году, причем не в инженерном журнале, а в философском Mind. За основу он взял салонную игру тех лет: судья переписывается записками с мужчиной и женщиной в соседней комнате и пытается угадать, кто есть кто. Тьюринг предложил посадить на одно из мест машину. Сам вопрос «может ли машина мыслить» он считал бессмысленным спором о словах и заменил его проверяемым экспериментом: если по переписке машину не отличить от человека — какая, собственно, разница.

Вопросы в статье есть только для примера — про сонеты, арифметику и шахматы. Зато есть прогноз: к 2000 году машина с памятью в миллиард бит сможет обманывать среднего судью в тридцати процентах случаев за пять минут беседы. Миллиард бит — это около 128 мегабайт. Флешку с такой памятью вы сегодня просто не найдёте в продаже.

Важно понимать, из какого мира писалась эта статья. Компьютер 1950 года — махина размером с комнату, и спор о «мыслящих машинах» шел в понятиях той эпохи: оппоненты Тьюринга возражали, что машина никогда не напишет сонет от переполняющих чувств, не пошутит, не устыдится. Душа — человеку, арифметика — машине. Это казалось очевидным, и весь дальнейший спор строился вокруг этой границы.

Читать далее

+9

Magnificus 19 июл в 09:56

Атака на LLM, которую нельзя исправить патчем

Простой

14 мин

14K

Блог компании BotHubИскусственный интеллектМашинное обучение * Научно-популярноеЧитальный зал

Что вершит судьбу LLM в этом мире? Некая незримая инструкция или закон, подобно промту Господнему, парящим над миром? По крайне мере истинно то, что LLM не властен даже над своей волей.

В 2025 году главной угрозой кибербезопасности по версии OWASP стал не вирус и не баг, а обычный человеческий язык. Многие думают, что проблему можно решить, просто запретить модели нарушать правила. Но это так не работает. Promt Injection нельзя просто выключить, потому что так вы все сломаете.

Как работает главная уязвимость LLM? Почему с ней так тяжело бороться? И что все-таки делать, чтобы защититься от нее?

Читать далее

+23

rsashka 16 июл в 05:34

ИИ зависимость и лекарство от prompt injection (в том числе от системного промпта провайдера)

Средний

8 мин

8.9K

Блог компании BotHubИскусственный интеллектИсследования и прогнозы в IT * Программирование * Управление разработкой *

Кейс

Повсеместная экспансия различных ИИ-ассистентов во все сферы достигла такой глубины, что её впору сравнить с наркотической зависимостью. Эйфория от кратковременного всплеска производительности, который получается в самом начале внедрении интеллектуальных инструментов, даёт очень быстрый и измеримый экономический эффект, который подстёгивает компании встраивать ИИ в любой процесс.

Но именно этот первоначальный краткосрочный успех запускает механизм, который невозможно остановить, так как возникает замкнутый круг, напоминающий перефразированное высказывание Красной Королевы из «Алисы в Стране чудес»: чтобы просто сохранить позиции на рынке, нужно бежать изо всех сил, а чтобы вырваться вперёд конкурентов - нужно бежать ещё быстрее. Ведь подобная гонка внедрения ИИ решений во все сферы приносит ощутимые кратковременные экономические выигрыши, однако долгосрочные последствия такой зависимости от ИИ-решений становятся всё более печальными.

Читать далее

+5

Irvin_Nivri 15 июл в 15:14

Сравниваем LLM, 12 тестов для среднего класса: три Sonnet против GigaChat 2 MAX и YandexGPT Pro 5.1

55 мин

17K

Блог компании BotHubИскусственный интеллектНаучно-популярное

Обзор

В первой статье цикла мы гоняли по 12 тестам Opus 4.8, GPT 5.5 и Gemini 3.1 Pro, во второй устроили дуэль тяжеловесов Claude Fable 5 и GPT 5.5 Pro. В комментариях нас несколько раз спросили: а что там у моделей попроще и, главное, у отечественных? Спрашивали — отвечаем. Сегодня на ринге средний класс: три поколения рабочей серии Anthropic — Claude Sonnet 4.5, Sonnet 4.6 и свежий Sonnet 5 — против старших отечественных моделей: GigaChat-2 MAX от Сбера и YandexGPT Pro от Яндекса.

Сразу о главном: почему такой состав. Мы долго думали, по какому принципу собрать пятерку, чтобы сравнение не превратилось в избиение младенцев, и остановились на цене. Fable 5 и GPT 5.5 Pro из прошлой статьи — это «Формула-1»: один запрос с большим вложением у них стоил сотни, а то и тысячи рублей. Сегодняшние участники — то, чем реально возят грузы: Sonnet у Anthropic — массовая серия, в разы дешевле Opus, а GigaChat-2 MAX и YandexGPT Pro хоть и старшие модели своих экосистем, но по цене токена играют в той же лиге, что и Sonnet, а не в лиге западных флагманов. Забегая вперед: по нашим же чекам типовой запрос без вложений у всей пятерки стоит единицы рублей. Один ценовой класс — значит, сравнение равных. А вот внутри класса, как выяснится, разброс возможностей огромный.

Методика не меняется. Никаких бенчмарков и маркетинга — только реальные будничные задачи. Тестируем через агрегатор нейросетей BotHub: он работает по API, а этот метод избавлен от подпорок и костылей, которые неявно помогают моделям в их веб-интерфейсах. Заодно сразу видим, во сколько каждое решение обходится по деньгам. Затраты по-прежнему измеряем в CAPS — внутренней валюте BotHub, привязанной к числу затрачиваемых токенов. Напомним, за рубль можно купить от 4000 до 6500 CAPS в зависимости от объема покупки, считаем по курсу примерно 1 рубль = 6370 CAPS.

Читать далее

+34

rsashka 13 июл в 13:45

Механизм возникновения сознания у конечных автоматов

Средний

5 мин

18K

Блог компании BotHubИскусственный интеллектАлгоритмы *

Мнение

Конечный автомат - это математическая модель вычислений: абстрактная машина, которая в каждый момент времени находится ровно в одном из конечного множества состояний, а переходы между состояниями происходят в ответ на входные сигналы (события) по заранее заданным правилам. Традиционно эту модель воспринимают как примитивную формализацию, пригодную лишь для распознавания регулярных языков и реализации жёстко детерминированных реактивных контроллеров.

На первый взгляд, подобная абстракция кажется чересчур примитивной, чтобы вместить в себя искусственный интеллект или самосознание. Однако если рассматривать сознание не как статический атрибут отдельного элемента, а как эмерджентное свойство, возникающее на стыке взаимодействия миллионов автоматных переходов, то граница между вычислительной машиной и мыслящей системой с самосознанием оказывается неожиданно тонкой.

Читать далее

+13

Magnificus 12 июл в 13:50

Выбираем лучшую нейросеть для видео 2026

Простой

13 мин

16K

Блог компании BotHubМашинное обучение * Программирование * Искусственный интеллектЧитальный зал

Обзор

Привет Хабр!

В прошлых годах видео от нейросети было заметна по характерным огрехам. По плывущим лицам, лишним пальцам и кривому движению. Как дела обстоят в середине 2026-го?

Мы взяли пять топовых генераторов видео — Veo 3.1, Kling v3 Omni, Sora 2 Pro, LTX-2.3 Pro и Grok Imagine Video 1.5 — и прогнали их через 7 одинаковых сценариев. Одинаковые промпты, одинаковые настройки, равные условия. От средневекового рыцаря до жонглёра, кота-паникёра и Уилла Смита, уминающего спагетти.

Погнали.

Читать далее

+23

DashaPasha 9 июл в 18:48

Вышла новая GPT-5.6, GPT-Live и ChatGPTWork: что подготовили OpenAI

Простой

7 мин

15K

Блог компании BotHub

Обзор

Июль 2026 года для OpenAI оказался выходит насыщенным: она одновременно обновила два разных уровня своей платформы: базовый слой языковых моделей и слой голосового взаимодействия. GPT-5.6 вышла как новое семейство моделей для API и Codex, а GPT-Live стала новой голосовой системой ChatGPT Voice. В сумме это выглядит не как косметический релиз, а как заметный сдвиг в архитектуре продуктовой линейки OpenAI.

Если упростить до одной фразы, то GPT-5.6 отвечает на вопрос «какую текстовую модель выбрать под конкретную задачу», а GPT-Live — на вопрос «как вообще должен выглядеть голосовой интерфейс с ИИ в 2026 году». И именно поэтому эти анонсы стоит рассматривать вместе.

Читать далее

+5

DashaPasha 9 июл в 08:09

ИИ от 1 млрд параметров и конец ChatGPT-врапперов: разбираем новый закон об искусственном интеллекте в России

Средний

16 мин

3.9K

Блог компании BotHub

Аналитика

Закон «О поддержке развития технологий искусственного интеллекта в Российской Федерации» принят во втором и третьем чтениях. Разбираемся в неточностях, ныряем за подводными камнями и пытаемся понять, что делать с несчастным 1 миллиардом параметров.

Читать далее

-1

Irvin_Nivri 7 июл в 06:01

Сравниваем LLM, 12 тестов для Claude Fable 5 и GPT 5.5 Pro

Средний

35 мин

8.5K

Блог компании BotHubИскусственный интеллектНаучно-популярное

Обзор

В прошлой статье мы устроили большое сравнение Opus 4.8, GPT 5.5 и Gemini 3.1 Pro и оговорились: GPT 5.5 Pro в том матче не участвовала, потому что ее корректнее сравнивать с недоступной на тот момент Fable. Что ж, обещания надо выполнять. Anthropic внезапно вернула Claude Fable 5 в общий доступ. Напомню, это первая модель нового класса Mythos, которая в иерархии компании стоит выше Opus. Значит, пришло время дуэли тяжеловесов: Claude Fable 5 против GPT 5.5 Pro.

Методика не меняется. Никаких бенчмарков и маркетинговых обещаний — только реальные будничные задачи. Тестируем через агрегатор нейросетей BotHub: он работает по API, а этот метод избавлен от подпорок и костылей, которые неявно помогают моделям в их веб-интерфейсах. Заодно сразу видим, во сколько каждое решение обходится по деньгам.

Затраты по-прежнему измеряем в CAPS — внутренней валюте BotHub, привязанной к числу затрачиваемых токенов. Напомним, за рубль можно купить от 4000 до 6500 CAPS в зависимости от объема покупки. В этот раз считаем по курсу примерно 1 рубль = 6370 CAPS, т.к. у меня сменился тариф. И сразу приготовьтесь: обе модели — премиальный сегмент, так что ценники будут заметно выше, чем в прошлый раз.

Победителя, как и раньше, чаще всего будем определять субъективно, уж простите нам эту вольность. Все материалы прикладываем, так что вы можете не согласиться с нашим мнением и выбрать своего фаворита.

Читать далее

+10

Magnificus 30 июн в 08:56

Лучшие нейросети для картинок в 2026. Сравнение Midjourney, Qwen, FLUX, Nano Banana, GPT и Grok на одних промптах

Простой

17 мин

13K

Блог компании BotHubМашинное обучение * Программирование * Искусственный интеллектОбработка изображений *

Обзор

В 2026 году выбрать нейросеть для картинок часто сложнее, чем написать промпт. Моделей много, каждая обещает лучшее качество, а на деле у каждой есть свои особенности. Мы взяли шесть разных популярных моделей, прогнали шесть сценарных тестов на одинаковых промптах и собрали картинки, чтобы вы могли сравнить все своими глазами, а не по рекламным скриншотам.

Сегодняшние участники:

Midjourney (v7) | Qwen Image 2 Pro

FLUX 2 Max | Nano Banana Pro

GPT Image 2 | Grok Imagine (режим image quality)

У нас было: 6 моделей для генерации, 6 сценариев использвования, для всех моделей одинаковой промт и 4 критерия для оценки результат.

Победитель оказался неожиданным.

Читать далее

+19

Irvin_Nivri 26 июн в 13:44

Как измеряют LLM: параметры, бенчмарки и тесты на коленке

Средний

22 мин

8.8K

Блог компании BotHubИскусственный интеллектНаучно-популярное

Обзор

В комментариях к моей предыдущей статье о тестировании трех флагманских LLM моделей были примерно такие мысли и вопросы:

Читать далее

+4

Magnificus 25 июн в 08:51

Как правильно выбрать эмбеддинг для проекта

Средний

20 мин

13K

Блог компании BotHubПрограммирование * Машинное обучение * Искусственный интеллектБазы данных *

Обзор

Эмбеддинги (иначе говоря, векторные представления) — это способ представления абстрактных данных в виде набора чисел (в виде векторов, как вы могли уже понять), близкие значения которых связаны семантически и математически и с которыми может работать модель искусственного интеллекта.

Разберемся какие модели лучше других подходят для кодирования слов. Параллельно с этим разберём принципы, на которые нужно опираться при выборе эмбеддинг-модели, пощупаем русские BERT-модели и внесём ясность про системные требования, контекстное окно и размер батча.

Читать далее

+35

Irvin_Nivri 19 июн в 13:47

Сравниваем LLM: 11 тестов для Opus 4.8, GPT 5.5 и Gemini 3.1 Pro

Средний

56 мин

13K

Блог компании BotHubИскусственный интеллектНаучно-популярное

Обзор

Меньше месяца назад Anthropic выпустила модель Claude Opus 4.8. Как обычно, заявили много новых плюшек, вроде улучшенного кодинга и режима Fast Mode. Нам это показалось отличным поводом, чтобы устроить ее сравнение с двумя другими тяжеловесами рынка от Google и OpenAI.

Никакие бенчмарки и маркетинговые обещания нас не интересуют — мы будем сравнивать модели по тому, как они справляются с реальными будничными задачами. В этом сравнении нам поможет агрегатор нейросетей BotHub: это возможность оценить качество ответов на живых примерах и сразу понять, во сколько решение обходится по деньгам. Кроме того, это сделает тест чище. Ведь BotHub работает по API, а этот метод избавлен от многих подпорок и костылей, которые неявно помогают моделям в их веб‑интерфейсе.

Измерять затраты мы будем в CAPS — это внутренняя валюта BotHub, чем больше вы ее покупаете, тем дешевле единица. Эта валюта напрямую привязана к числу затрачиваемых моделью токенов, потому она хорошо покажет стоимость разных задач для разных моделей. Если грубо, то за рубль можно купить от 4000 до 6500 CAPS. В этом тесте будем считать, что 1 рубль = 4000 CAPS.

Победитель чаще всего будет определяться субъективно, уж простите нам эту вольность. Скорее всего все наши участники в том или ином виде справятся с задачами, вопрос будет лишь в качестве. Хотя явные завалы, конечно, будут отмечены позорным клеймом. В любом случае, все итоги мы приложим и вы можете не согласиться с нашим мнением и выбрать своего фаворита.

В нашем сравнении примут участие три флагманские модели:

К тестам

+18

rsashka 19 июн в 05:24

Сладкие оковы вайб- к̶о̶д̶и̶н̶г̶а̶ инжиниринга [часть 2]

Средний

7 мин

11K

Блог компании BotHubC++ * Искусственный интеллектПрограммирование * Управление разработкой *

Мнение

Это вторая статья об использовании LLM в проекте разработки компилятора языка программирования как транспилятора в код на C++. Я продолжаю историю и хочу рассказать о своих наблюдениях и впечатлениях от попыток применять автономных агентов в большом и сложном проекте. А также о навязчивой рекламе и встроенных «закладках» в коде некоторых инструментов, которые, похоже, целенаправленно ухудшают работу с моделями конкурентов.

Читать далее

-1

DashaPasha 15 июн в 06:11

Контекстное окно: почему нейросеть забывает части разговора

Средний

20 мин

13K

Блог компании BotHubИскусственный интеллектНаучно-популярное

Обзор

Представьте, что вы разговариваете с невероятно умным и эрудированным собеседником. Только очень странным. Несмотря на весь свой интеллект и тысячи фактов, которые он легко и непринужденно рассказывает, он не может ничего запомнить. Ваш диалог с ним каждый раз как бы начинается заново. Вы даете ему вводные, задаете вопросы, что-то уточняете, а он, на основе всего этого, выдает ответ.

Однако, стоит вам задать следующий вопрос, как собеседник напрочь забывает все, о чем вы говорили. И чтобы отвечать более-менее связно, ему приходится сначала перечитать весь ваш диалог.

Звучит странно? Возможно. Однако именно так работает большинство современных LLM. А разработчики, пытаясь нивелировать эту особенность, добавляют нейронкам различные обвязки и ухищрения, заметно усложняя логику для рядового пользователя.

Чтобы лучше понимать, что происходит, давайте погрузимся в тему. И подробнее познакомимся с такой штукой, как «контекстное окно».

Читать далее

+30

Magnificus 8 июн в 11:47

Актуальный гайд на Cursor в 2026 году

Простой

11 мин

34K

Блог компании BotHubПрограммирование * Машинное обучение * Искусственный интеллектЛайфхаки для гиков

Туториал

Привет, Хабр!

К 2026-му году Cursor стал полноценной средой для кодинга без…. кодинга. Вместо этого вы оперируете ИИ-агентами и отдаете им приказы. Ручное программирование с каждым годом становится ближе к статусу «истории». Cursor является лучшим ПО для работы с агентами и вайбкодинга.

В этом гайде мы без воды рассмотрим такие аспекты программы как: интерфейс, работа с контекстом, режимы агента, модели, правила проекта, MCP, skills, hooks и др.

Актуально на лето 2026 года. На момент написания самая свежая версия — Cursor 3.6.

Поехали.

Читать далее

+43

Magnificus 27 мая в 09:33

RAG-Anything: Как собрать по-настоящему мультимодальный RAG

Средний

8 мин

13K

Блог компании BotHubМашинное обучение * Искусственный интеллектЛайфхаки для гиковПрограммирование *

Обзор

Существует множество известных RAG-фреймворков, проверенных на многочисленных бенчмарках, так что точность работы системы в наших реалиях не такая большая проблема. Однако, для любого, кто сталкивался с прикладной интеграцией RAG в рабочие пайплайны, не секрет, что рано или поздно сталкиваешься с постобработкой форматов, отличных от текста. Комбинируешь OCR, парсеры, ридеры…

RAG-Anything устраняет ненужные телодвижения.

С помощью RAG Anything возможно обрабатывать подавляющее большинство ходовых форматов файлов(PDF, DOC, PPTX, XLS, JPG, BMP, GIF и др. )

В этой статье мы разберем механизм работы фреймворка и на примере посмотрим, как он работает.

Читать далее

+19

1

2 3 ...