Обновить
1024K+

Машинное обучение *

Основа искусственного интеллекта

1 099,32
Рейтинг
Сначала показывать
Порог рейтинга
Уровень сложности

Как бизнесу стать технологичнее без перестройки подразделений

Уровень сложностиПростой
Время на прочтение4 мин
Охват и читатели1.3K

Искусственный интеллект в мировой экономике уже стал массовым инструментом: рынок связанных с ним технологий быстро растет. По прогнозу Roots Analysis, к 2035 году глобальный рынок ИИ-агентов может почти достичь 221 млрд долларов против 9,8 млрд в 2025 году, при среднегодовом темпе роста 36,55%.

В мире 88% компаний уже используют генеративный ИИ в тех или иных функциях — от клиентского сервиса и маркетинга до логистики, HR, финансов, производства и аналитики. Но реальный финансовый эффект, выраженный в стабильном росте операционной прибыли, отмечают только 6% компаний.

Расскажем о проблемах фрагментарного внедрения ИИ и необходимости горизонтального слоя AI Overlay для настоящей трансформации бизнеса, а также о ключевых блоках необходимой архитектуры.

Материал подготовлен на основе экспертной колонки старшего вице‑президента Сбера, руководителя блока «Технологий» Кирилла Меньшова, опубликованной в RBC.

Читать далее

Новости

Конец эпохи ESI: Открытие Закона Критической Плотности и пересмотр списка обитаемых миров на основе ExoLogica AI

Уровень сложностиСредний
Время на прочтение26 мин
Охват и читатели2.7K

Десятилетиями мы искали жизнь не там

Астрономы всего мира молились на один показатель — ESI (Earth Similarity Index). Если планета имела размер как у Земли и находилась в «зоне Златовласки», заголовки трубали: «Открыта Вторая Земля!». NASA радовалось, пресса ликовала, гранты выделялись.

Но всё это было иллюзией

Индекс ESI игнорирует самое главное — то, что находится внутри планеты. Он считает «похожими на Землю» миры-океаны без суши и мёртвые железные ядра без атмосферы. В результате в списках потенциально обитаемых миров оказались планеты, где жизнь физически невозможна.

Сегодня я представляю Закон Экзолоджики — новый фундаментальный принцип, который математически перечёркивает старые списки и вводит жёсткий физический фильтр для поиска жизни. На основе анализа 42 экзопланет через систему ExoLogica AI мы доказали: обитаемость зависит не от температуры, а от плотности.

И результаты шокируют. Знаменитый Kepler-452 b («кузен Земли») вылетает из списка обитаемых миров мгновенно. Ross 508 b, Teegarden's b — тоже. Но есть и хорошие новости: настоящие кандидаты наконец-то найдены.

Приготовьтесь. Эпоха наивного поиска закончилась.

Читать далее

Имитация движений: как научить робота повторять движения, используя нейросеть для генерации траектории

Уровень сложностиСредний
Время на прочтение26 мин
Охват и читатели4.5K

Имитация движений: как научить робота повторять движения, используя нейросеть для генерации траектории.

Читать далее

Круглые тензоры: как докатиться до AGI и сэкономить память

Уровень сложностиПростой
Время на прочтение4 мин
Охват и читатели4.6K

Круглый тензор… Как много в этом словосочетании для сердца обычного млщика. Круглые тензоры пытаются тащить вместо того, чтобы катить, их хотят загнать в круглые GPU и вообще воспринимают несерьёзно. А быть может они этого не заслужили?

Пора сорвать покровы и показать, что круглый тензор не просто реален, но и способен — ни много, ни мало — помочь преодолеть пресловутое проклятие размерности.

Читать далее

OpenAI, Disney, $1 млрд и крах за 4 месяца. Что случилось с Sora?

Уровень сложностиПростой
Время на прочтение5 мин
Охват и читатели5.1K

Миллиарды долларов сожжены — и почти ничего не получено в виде выручки. Таково наследие Sora, анонсированной OpenAI в декабре 2025 года и официально закрытой 24 марта 2026-го.

Это не просто крах очередного ИИ-проекта. Последствия могут оказаться серьёзными для Сэма Альтмана, OpenAI и всего ИИ-пузыря в целом.

Читать далее

Нейро Дюбель: Первая нейрогруппа была основана в Минске еще в 1989 году

Уровень сложностиПростой
Время на прочтение5 мин
Охват и читатели4.1K

История технологий часто скрывает свои самые смелые прорывы под маской субкультуры. Пока Кремниевая долина только грезила о перцептронах, в Минске конца 80-х уже функционировал проект, опередивший время на тридцать лет. Сегодня, в эпоху ChatGPT и Midjourney, пора признать очевидное: коллектив «Нейро Дюбель» был не просто рок-группой, а первым в мире успешным экспериментом по внедрению нейросетевых алгоритмов в массовую культуру.

Читать далее

ИИ-агенты не справляются не потому что тупые

Уровень сложностиСредний
Время на прочтение6 мин
Охват и читатели4.9K

Сейчас многие компании внедряют ИИ-агентов в свои процессы. И сталкиваются с проблемами. Классический пример: ИИ-агент по продажам самостоятельно пообещал клиенту скидку 50% на которую ему никто не давал разрешения. Явный провал разработчиков ИИ-агентов, хотя на прошлой неделе в демо всё работало идеально.

Мир явно разделился: одни говорят, что агенты готовы к продакшену, другие кричат что это не работает и работать не будет. Энтузиасты показывают впечатляющие демо. Чистые данные, правильные API, никаких сюрпризов. Но продакшен это другой зверь. Отчёт MIT показал, что 95% пилотов генеративного ИИ не достигают ожидаемых результатов. Модели не тупые. Инфраструктура вокруг них не готова.

Я это понял на собственном опыте, строя своего агента на базе OpenClaw, который отчитывается мне ежедневно в Telegram. Все здесь крайне интересно, но реальные области использования нащупать сложно.

Читать далее

Игра в угадайку

Уровень сложностиСредний
Время на прочтение13 мин
Охват и читатели7.1K

Играют двое: загадывающий и отгадывающий. Загадывающий загадывает целое число в известном диапазоне — скажем, от 1 до 100 включительно. Отгадывающий пытается это число отгадать, называя варианты. После каждого неверного варианта загадывающий говорит: «больше» или «меньше».

Задача: отгадать число за минимальное количество попыток, используя минимальный объем вычислений.

Вам кажется, что это очень просто? Поверьте, это совсем не так!

Читать далее

Симулятор JWST на Python: как критика Хабра заставила выучить астрофизику и почему мы сделаем открытие раньше NASA

Уровень сложностиСредний
Время на прочтение11 мин
Охват и читатели5.9K

Некотороевремя назад я пришел на Хабр с простеньким ML‑скриптом, который искал обитаемые экзопланеты. Я ждал похвалы, но вместо этого получил в комментариях ведро ледяной воды: «Где валидация? Что будет при сдвиге распределения? Машинное обучение без физических лимитов — это декорация!».

Вызов был принят. Я выбросил наивный подход, запер XGBoost в клетку суровых законов термодинамики и переписал всё с нуля.

Спустя недели разработки и чтения научных статей я представляю ExoLogica AI 2.0. Теперь это не табличный калькулятор, а 14-ступенчатый астрофизический конвейер. Он считает долю железного ядра, оценивает гидродинамическое сдувание атмосферы и — самое главное — генерирует синтетические спектры для телескопа Джеймса Уэбба (JWST) на лету.

Под катом: почему знаменитый индекс подобия Земле (ESI) безнадежно устарел, за что наш скрипт выбросил в мусорку кандидатов от Корнеллского университета, и почему гаражный опенсорс с Хабра имеет все шансы сделать великое открытие раньше, чем бюрократы из NASA.

Читать далее

Оптимизация комплаенса без лишних затрат: как мы сократили нагрузку на команду с помощью трёх метрик

Уровень сложностиСредний
Время на прочтение6 мин
Охват и читатели5.8K

Привет! Я Томирис, аналитик данных в отделе финансового мониторинга в ЮMoney. Хочу показать кусочек нашей внутренней кухни: как мы пересобрали AML-процессы и перестали тонуть в отчётах.

В любой финансовой организации, работающей с розничными и корпоративными клиентами, система ПОД/ФТ (или AML — противодействие отмыванию денег и финансированию терроризма) играет ключевую роль. Помимо машинных алгоритмов онлайн-реагирования и автоматических ограничений, по-прежнему большую роль играют периодические отчёты и выборки по риск-критериям. Они помогают находить сигналы о потенциально незаконных операциях.

В этой статье мы сосредоточимся на периодическом мониторинге кошельков физических лиц (сегмент B2C). Это самый «дорогой» сегмент: здесь больше всего отчётов, операций и ручной работы комплаенс-аналитиков.

Читать далее

Terrafab, Starship, IPO: три обещания Маска, которые вызывают вопросы

Уровень сложностиПростой
Время на прочтение9 мин
Охват и читатели6K

Изначально идея орбитального дата-центра от Маска казалась амбициозной, но технически сомнительной. Теперь, когда появились подробности о том, как он планирует реализовать этот грандиозный замысел, проект выглядит ещё менее осуществимым, чем казалось раньше. Либо это результат чрезмерного оптимизма, либо здесь происходит что-то более сложное.

Давайте начнём с самого начала. Вопреки заявлениям Маска, орбитальные ИИ-дата-центры не дешевле наземных. Как я уже писал ранее, запуск ИИ-дата-центров в космос обходится примерно в девять раз дороже, чем их эксплуатация на Земле — так что даже во время энергетического кризиса орбитальные дата-центры значительно дороже.

Вдобавок потребуются десятки триллионов долларов, чтобы построить и развернуть в космосе 100 ГВт солнечных панелей, которые обещал Маск, — и их придётся полностью заменять каждые пять лет или около того, когда спутники, к которым они прикреплены, сойдут с орбиты.

Да, и строительство этих спутников на Луне, как предлагал Маск, не решает ни одну из этих проблем и, по сути, только усугубляет их.

Тем не менее, Маск всё ещё хочет развернуть орбитальную констелляцию из миллиона спутников с ИИ-дата-центрами!

Читать далее

Галлюцинации LLM — это артефакты сжатия. И это объясняет вообще всё

Уровень сложностиПростой
Время на прочтение5 мин
Охват и читатели14K

Представьте: вам дают 10 терабайт текста и говорят — запихни это в файл на 70 гигабайт. Так, чтобы потом по любому вопросу можно было восстановить нужный кусок. Не точно, но близко. Не побайтово, но по смыслу.

Вы бы сказали: «это lossy-компрессия, часть данных неизбежно потеряется».

И были бы правы. Потому что именно это делает LLM.

Читать далее

LoRA не помогла: как мы дообучали Mistral 7B на русском и что в итоге сработало

Уровень сложностиСредний
Время на прочтение6 мин
Охват и читатели6.1K

Каждый раз после созвона происходит одно и то же самое: кто-то открывает чат и пишет «итак, что мы решили?». Дальше — пятнадцать минут на то, чтобы восстановить то, что только что обсуждали час.

Я ML-инженер, и эта боль мне была знакома лично. Когда появилась идея автоматизировать протоколирование встреч, казалось, что задача решаемая: берешь Whisper для распознавания речи, хорошую LLM для суммаризации — и готово.

Реальность оказалась другой. Готовых русскоязычных решений нужного качества не было. Mistral 7B — одна из лучших открытых моделей на тот момент — на русском ошибался в склонениях, плохо следовал русскоязычным промптам и терял смысл в длинных диалогах. Стало понятно: придётся дообучать самим.

Читать далее

Ближайшие события

Топ 13 инструментов для сбора саммари из видео, аудио, текстов и PDF

Уровень сложностиПростой
Время на прочтение9 мин
Охват и читатели5.5K

Как я уже не раз отмечал в своих предыдущих материалах, инструменты со встроенными нейросетевыми примочками развиваются быстро. Буквально за несколько месяцев одни сервисы успевают захватить новые, порой совсем неожиданные ниши, а другие — обрасти таким количеством функций, что их создатели сами путаются в настройках. Рынок кипит, и уследить за всем практически невозможно.

Сегодня представлю очередную подборку, но уже с конкретным, довольно узким уклоном. В прошлый раз я пристально смотрел на генерацию кода и презентаций. Теперь же поговорим о саммари. Под этим модным словом скрывается технология сжатия информации до ключевых вещей, когда из простыни текста вам выдают три‑четыре тезиса, а из часовой лекции — двухминутную выжимку.

Признаюсь честно: я за полные версии. Будь то книги, видео или лекции. Мне важно видеть ход мысли автора, детали. Саммари же часто принимают некоторые важные вещи за воду и безжалостно их удаляют, оставляя сухой, а порой и искаженный остаток. И все же, при всей моей любви к оригиналам, не озвучить интересные варианты в этой сфере, увы, не могу. 

Принимайте стратегически удобное положение, ну а я начинаю.

Читать далее

Ultra Deep Research: триангуляция AI-поиска через три нейросети

Уровень сложностиПростой
Время на прочтение9 мин
Охват и читатели5K

Вы спрашиваете нейросеть — она идёт в интернет и возвращает ответ. Но в какой именно интернет?

Claude ищет через Brave. ChatGPT — через Bing. Gemini — через Google. Три разных поисковых движка, три разных среза, совпадение результатов около 20%.

Я выстроил подход к AI-ресёрчу вокруг этого факта: три уровня, от быстрого вопроса до триангуляции через все три движка. И всё равно нарвался: два AI синхронно соврали.

Плюс бонус-левел: что делать, когда весь интернет врёт и нужен хирургический скальпель вместо широкого поиска.

Читать далее

Утекли исходники Claude Code

Уровень сложностиСредний
Время на прочтение16 мин
Охват и читатели36K

Anthropic забыли добавить *.map в .npmignore — и весь исходный код Claude Code оказался в открытом доступе через npm. Тамагочи в терминале, система снов для консолидации памяти, режим прикрытия для коммитов в open-source, 30-минутные сессии планирования на удалённом Opus 4.6, мультиагентный рой с координатором — и всё это спрятано за feature flags, которые source map’ы радостно проигнорировали. Разбираем, что нашлось внутри.

Круто! Читать далее

Люди набирают 100%, GPT-5.4 — 0,26%, а Google хватило всего лишь 3-бит

Уровень сложностиПростой
Время на прочтение3 мин
Охват и читатели7.6K

Седьмой выпуск еженедельных IT-новостей от OpenIDE: новый бенчмарк AGI, которому модели не смогли угодить, трёхбитная квантизация от Google, ACP-протокол в OpenIDE, GigaChat 3.1 и бесславный конец Sora.

Читать далее

Как мы автоматизировали модерацию карточек товаров с помощью Computer Vision в Wildberries

Уровень сложностиСредний
Время на прочтение18 мин
Охват и читатели4.6K

Привет! Я Дмитрий Колесников, Team Lead DS-команды «Платформа модерации» в Wildberries & Russ. В этой статье по мотивам моего доклада на HighLoad расскажу, как у нас получилось превратить сотни Computer Vision моделей в единый масштабируемый пайплайн, который ежедневно обрабатывает 15 млн карточек товаров (50+ млн изображений и 500K видео).

Читать далее

Книга: «Основы GraphRAG. Улучшенный RAG на базе графов знаний»

Время на прочтение2 мин
Охват и читатели6.8K

Привет, Хабожители! Создайте и разверните систему GraphRAG производственного уровня. Научитесь извлекать структурированные знания из текста и комбинировать методы векторного поиска с поиском по графам. Книга богата практическими примерами: от создания инструмента поиска по векторному сходству и приложения Agentic RAG до оценки эффективности и точности результатов работы такого приложения.

Читать далее

Amazon уволила инженеров, заменила их ИИ и получила 6-часовой аутфолл на $490 млн

Время на прочтение9 мин
Охват и читатели15K

CEO Nvidia и профессиональный ИИ-энтузиаст Дженсен Хуанг недавно заявил, что мы уже достигли AGI (искусственного общего интеллекта). Во-первых, это вызывает серьёзные вопросы к его пониманию интеллекта. Современные ИИ-системы больше напоминают глубоко галлюцинирующего плагиатора-подхалима, чем что-либо похожее на связный интеллект. Беззубый дедок в потрёпанной шапке, подпирающий барную стойку моего местного паба с 11 утра каждый день, обладает бесконечно большим интеллектом, чем эти «статистические машины по сглаживанию кривой». С ним, кстати, и поговорить куда интереснее.

Но, во-вторых, это просто не происходит, шеф! И Дженсен бы это знал, если бы отвлёкся от подсчёта миллиардов долларов, заработанных на круговом финансировании, и взглянул на реальные возможности генеративного ИИ в настоящем мире. Знаете, там, где интеллект — это не какая-то псевдоинтеллектуальная спекулятивная концепция, а критически важная штука для реальных результатов.

Возьмём, к примеру, Amazon. В третий раз они усвоили болезненный урок: генеративный ИИ не обладает интеллектом, не может заменить человеческий интеллект и не является инструментом продуктивности.

Впрочем, я говорю «усвоили»… Что там та фальшивая цитата Эйнштейна об определении безумия? Что-то про повторение одних и тех же действий в ожидании разных результатов?

Читать далее
1
23 ...