Обновить
1121.9

Машинное обучение *

Основа искусственного интеллекта

Сначала показывать
Порог рейтинга
Уровень сложности

Русский культурный код как оценка генеративных моделей

Время на прочтение9 мин
Охват и читатели2K

Привет! Когда вышла Nano Banana, я из любопытства попросил её нарисовать сюр на фоне советских панелек — и она нарисовала до безумия залипательную картинку. Она не просто нарисовала панельки, не просто идеально отработала промпт, она точно передала вайб и всю атмосферу.

Так родилась идея этого мини-бенчмарка. Не академического, не на тысячи промптов и сотни метрик — а простого, народного и визуального. Чтобы посмотреть картинки разных моделей рядом и все было сразу понятно: где Шурик взял шаву на ход ноги, а где доктор Ливси спотыкается об поребрик.

Читать далее

Новости

SpaceX строит мегасозвездие для ИИ, но законы физики нельзя обойти ни за какие деньги

Уровень сложностиПростой
Время на прочтение10 мин
Охват и читатели3.6K

Как бы вы ни относились к искусственному интеллекту — и в особенности к большим языковым моделям и чат-ботам, которые на нём работают, — реальность такова: человечество прямо сейчас строит и расширяет инфраструктуру для его поддержки. Это огромные сети дата-центров, пожирающих электричество и воду, — и их строительство всё чаще вступает в конфликт с потребностями людей, живущих по соседству.

Именно из-за этих проблем появилась идея: а что если вынести ИИ-дата-центры в космос? Одна из компаний, SpaceX, недавно объявила о планах построить мегасозвездие из миллиона спутников для этой цели.

Это пример зарождающейся технологии, способной решить проблему конкуренции за ограниченные ресурсы? Или это, как в своё время Hyperloop, красивая обёртка для нереализуемой идеи — где сам концепт не нарушает законов физики, но практические ограничения делают его настолько непрактичным, что воплотить обещанное невозможно?

Оказывается, на пути к созданию работающей сети ИИ-дата-центров в космосе стоит пять серьёзных препятствий. Три из них, в принципе, могут быть преодолены технологическим развитием. Последние два — установлены самой физикой Вселенной. И, скорее всего, именно они поставят крест на всей затее.

Читать далее

Сделайте внедрение ИИ человечнее

Уровень сложностиПростой
Время на прочтение9 мин
Охват и читатели4.1K

Не все проблемы внедрения ИИ упираются в качество моделей. Иногда сильнее мешают страх ошибиться, внутреннее сопротивление, недоверие и неловкость перед коллегами. Мы опросили 250+ человек из разработки и делимся опытом, как работать с такими барьерами и делать внедрение ИИ более комфортным для людей.

Читать далее

Как ИИ находит скрытые ошибки в настройках 1С:ERP

Время на прочтение7 мин
Охват и читатели4.3K

В 1С:ERP сотни настроек. Каждая из них может быть абсолютно правильной — но некоторые их комбинации в процессе эксплуатации начинают конфликтовать друг с другом. Система при этом продолжает работать, только всё хуже и хуже.

Бывает и по-другому: настройки выглядят вполне корректно, но на самом деле содержат скрытые проблемы, проявляющиеся по мере эксплуатации.

Чтобы находить такие ошибки, была создана экспертная система с использованием искусственного интеллекта. Она анализирует настройки ERP и выявляет потенциальные конфликты.

Я участвовал в разработке этой системы и покажу, как она работает на реальных примерах.

Читать далее

Непрерывность контекста как следующий слой эффективности ИИ: от ответа к воспроизводимости

Время на прочтение11 мин
Охват и читатели7.3K

В этой статье “контекст” не равен окну токенов и не сводится к длине истории чата. Непрерывность контекста — это сохранение рабочей преемственности между шагами: удерживаются цель и ограничения, не теряются принятые решения, фиксируются допущения и границы исходных данных, а при сбоях сохраняется способность вернуться в рабочий режим без перезапуска процесса.

Читать далее

Как Альтман превратил Пентагон в венчурный фонд OpenAI — и почему платить будем мы

Уровень сложностиПростой
Время на прочтение8 мин
Охват и читатели10K

Питер Тиль был учителем и наставником Сэма Альтмана. Для многих Тиль — фигура довольно зловещая. Некоторые называют его «технофашистом».

Однажды Тиль назвал своего протеже «выживальщиком» — и он, без сомнения, знал, о чём говорил.

Но Альтман — не только мастер выживания. Он ещё и мастер захвата территорий. И пока весь мир ждал, когда OpenAI обанкротится, он нашёл сверхмощного спонсора с неограниченными ресурсами, неуязвимого для рыночных сил.

Разумеется, за это «открытие» заплатим мы все. И я имею в виду не только американских налогоплательщиков, но и всех жителей планеты. И Сэма это вполне устраивает.

Читать далее

Выступил отрицателем AI на конференции SNUG Silicon Valley

Время на прочтение3 мин
Охват и читатели10K

AI - не микроархитектор, не проектировщик и не верификатор. Это все-лишь гламурный поисковик уже решенных и опубликованных задач. Именно такой вывод следовал из предоставленных мною на конференции SNUG Silicon Valley 2026 фактов как десятки студентов мучали ИИ чтобы решить мои задачки. Одну задачку ИИ решил лишь через полгода после выкладывания решений в интернет, другую за два месяца, потом пошла третья. При этом задачки были довольно банальные - мы в Самсунге даем делать такие статические конвейеры с контролем потока данных практикантам.

Вот постер, сопровождающий мою статью:

Читать далее

CapCut популярнее Gemini, а Яндекс — в топ-10 AI. Мобильный рейтинг a16z

Время на прочтение8 мин
Охват и читатели6.5K

Если вы следите за рынком генеративного ИИ по десктопным продуктам — у вас искажённая картина мира. Я серьёзно.

На вебе генеративный ИИ — это ChatGPT, Claude, Character.ai, Midjourney. Чат-боты, ролевые платформы, кодинг-ассистенты. Логично: люди сидят за компьютером и взаимодействуют с ИИ через текст. Но стоит переключиться на мобильный рейтинг — и картинка переворачивается. Из 50 самых популярных мобильных AI-приложений примерно 20 — это фоторедакторы и камеры. Не чат-боты. Не поисковики. Камеры.

a16z опубликовал свой ежегодный рейтинг топ-50 генеративных ИИ-продуктов по ежемесячным активным пользователям. Отдельно веб, отдельно мобайл. Эта статья — про мобильные приложения. И она рассказывает совсем другую историю, чем веб-рейтинг.

Дальше — пять наблюдений, которые я вытащил из данных, потом карта рынка и полный справочник всех 50 приложений.

Читать далее

ИИ-трейдер без кода: создаем бота для автоматизации торговли на базе OpenClaw

Уровень сложностиПростой
Время на прочтение7 мин
Охват и читатели13K

Настройте своего персонального ИИ-трейдера на базе OpenClaw в Telegram — полностью бесплатно и без единой строчки кода. Агент понимает естественный язык, работает с Finam Trade API и умеет сам писать и запускать Python-скрипты прямо в чате.

В этом туториале покажем, как настроить агента с нуля, подключить к Trade API и использовать его для сканирования рынка, алгостратегий и выставления ордеров по расписанию.

Читать далее

Как я учил компьютер понимать 122 000 фотографий — и почему сложностью оказались не нейронки, а слова

Уровень сложностиСредний
Время на прочтение14 мин
Охват и читатели5.5K

Я крайне редко на фрилансе получал заказы связанные с DS/ML, специалистов для таких задач обычно ищут не там. Причины разные: они требуют долгой интеграции, заказчик сам не понимает задачу, DS более конфиденциален, DS часто возникают внутри продукта, да и в последнее время этот сегмент на фрилансе съедается при помощи LLM: AI integration, RAG боты например.

Но, внезапно, мне в личку постучались с таким проектом.

Читать далее

Прогнозирование цен на Airbnb в Нью-Йорке

Время на прочтение13 мин
Охват и читатели6.4K

Привет, Хаброжители! Мы открыли предзаказ на книгу «Машинное обучение на табличных данных: XGBoost, глубокое обучение и ИИ» Марка Райана и Луки Массарона. Предлагаем ознакомиться с главой 3 «Машинное и глубокое обучение».

Чтобы сравнить машинное и глубокое обучение с точки зрения простоты, сопоставим два решения для конкретной задачи классификации табличных данных: прогнозирование того, будет ли объект недвижимости, предлагаемый в аренду на платформе Airbnb в Нью-Йорке (NYC), иметь цену больше или меньше средней цены в объявлениях Airbnb на этом рынке.

Читать далее

Как собрать Physical AI-конвейер на манипуляторе за 30 тысяч рублей: ROS2, LeRobot и end-to-end imitation learning

Уровень сложностиСредний
Время на прочтение9 мин
Охват и читатели6.9K

Вокруг Physical AI сейчас много шума, но если отбросить красивые слова, у большинства разработчиков до сих пор нет главного — воспроизводимого конвейера на реальном роботе, который можно поднять своими руками, покрутить, записать данные, обучить policy и вернуть её обратно в железо. Обычно всё рассыпается на отдельные куски: где-то есть teleop, где-то есть датасеты, где-то крутится ML-модель, но цельного ROS2-native пути от демонстрации до исполнения почти не видно. В статье вы получите решение, как собрать такой манипулятор самостояетельно и запустить все необходимые программные компоненты из open-source ROS2 пакетов.

Читать далее

Почему World Model ЛеКуна не спасёт ИИ

Уровень сложностиПростой
Время на прочтение19 мин
Охват и читатели5.6K

После неожиданного развода ЛеКуна и Мета, много говорят, о том, что тупик прогресса LLM будет преодолён через физику мира. То есть, работа нейросети с физическими данными окружающего мира позволит модели обрести смысл и понимание своих действий. У ЛеКуна есть базовая статья, которую никто не будет читать. Поэтому перескажу, как могу. По сути идея  заключается в том, что текущая траектория развития LLM обречена. Пока они предсказывают следующий токен, реальное понимание, возникновение реального смысла невозможно. ЛеКун предлагает обучать нейросети на физических данных мира, предполагая, что построение его модели позволит отбрасывать детали и концентрироваться на смысле.

Я согласен с ЛеКуном в том, что использование данных мира позволит частично решить проблему нехватки данных. Но здесь я вижу проблему, которую инженеры, возможно, не понимают. Физическая модель мира фактически гораздо беднее человеческих знаний. Всё бесконечное количество возможных падений описал Ньютон несколькими строчками формул. Сомневаюсь, что Лекун хочет потратить миллиарды долларов на этот замечательный вывод.

Читать далее

Ближайшие события

Gemini Embedding 2 + мультимодальный RAG: эмбеддим видео и картинки — разбор и туториал

Уровень сложностиПростой
Время на прочтение15 мин
Охват и читатели6.2K

10 марта Google выкатил Gemini Embedding 2 - embedding-модель, которая умеет превращать в векторы не только текст, но и картинки, видео, аудио и PDF. Причем все это ложится в одно векторное пространство. Раньше если вы хотели искать по видеобиблиотеке через RAG, приходилось городить огород: транскрибировать аудиодорожку, описывать кадры через Vision LLM, склеивать в текст, и только потом эмбеддить. Каждый шаг - потеря информации. Теперь можно скормить модели MP4 напрямую, и текстовый запрос «как настроить авторизацию» найдёт и статью из базы знаний, и фрагмент видеоинструкции.

Но сама по себе модель не решает проблему. LLM не может «прочитать» MP4, поэтому найденное видео без текстового описания - может быть бесполезно. Ключ - в правильной архитектуре: нативный эмбеддинг для поиска + параллельная генерация текстового описания для LLM: два канала, которые работают вместе и выводят мощь RAG наполную катушку.

В этой статье разберем что нового в Gemini Embedding 2 и построим полноценный мультимодальный RAG с нуля - Python, Supabase, Gemini API.

P.S. С кодом.

Читать далее

14 аварий на 800 000 миль — и это с водителем за рулём. Почему Tesla избегает тестов в Калифорнии

Уровень сложностиПростой
Время на прочтение5 мин
Охват и читатели6.5K

Мемификация того, как Маск раз за разом не выполняет даже малой доли своих обещаний по автопилоту, прошла путь от забавного до по-настоящему неловкого. У меня складывается впечатление, что именно это - больше чем что-либо другое - подорвало восприятие Маска как технологического визионера. Его неоднозначные политические взгляды терпели годами - до тех пор, пока всё больше людей не начали замечать расхождение между обещаниями и реальностью. И, похоже, это расхождение только растёт. Мне кажется, я понимаю почему.

Уже довольно давно Маск повторяет, что роботакси Tesla вот-вот появятся в Калифорнии - как только регуляторы дадут разрешение. В октябре 2025-го он заявил, что роботакси будут доступны «через несколько месяцев» и что компания «ждёт одобрения регуляторов в Калифорнии». Однако Reuters недавно выяснил, что Tesla зафиксировала ровно ноль миль автономного тестового вождения на дорогах Калифорнии в 2025 году. Более того - это уже шестой год подряд, когда Tesla не проезжает ни одной автономной тестовой мили в штате, несмотря на имеющееся разрешение.

Почему это важно? Потому что это указывает на прямо противоположную картину: не Tesla ждёт регуляторов, а регуляторы ждут Tesla.

Читать далее

Как мы вкатывались в генеративный ИИ и куда катимся дальше

Уровень сложностиСредний
Время на прочтение14 мин
Охват и читатели8.3K

Сегодня я хочу рассказать о внедрении финансового генеративного чат-бота в финтех и о том опыте, который был приобретен за время запуска этого проекта. Эта статья написана с целью объяснить концепции и трудности, с которыми мы с командой столкнулись, поэтому постараюсь обойтись без особого погружения в технические детали.

Приступим

re!think it: Как я уместил корпоративный бэкенд в один промпт (История сборки)

Уровень сложностиСредний
Время на прочтение10 мин
Охват и читатели6.5K

Краткая история о том, как утренняя переписка с моделью превратилась в создание системного промпта на 1000 токенов. Внутри заложен алгоритм размышлений, позволяющий модели работать вдумчиво и объясняющий ей на языке формул, как человек принимает решения (исходя из своего личного опыта и понимания).

То, чего я не ожидал на старте — на выходе получилась очень компактная системная инструкция. В действительности она заменяет огромное количество функций, которые ИИ-гиганты выстраивают вокруг моделей.

Читать далее

97 часов на одной RTX 4090: MoE с подключаемыми экспертами, самодистилляция и почему перплексия — плохая метрика

Уровень сложностиСредний
Время на прочтение5 мин
Охват и читатели6K

Всё началось с простой идеи: что если подключать к языковой модели новые «навыки» как приложения к смартфону — без переобучения, без деградации, за полчаса? Я потратил 22 шага экспериментов и 97.5 GPU-часов на одной видеокарте, чтобы это проверить. Архитектура заработала идеально. А потом выяснилось, что модель, которая говорит на языке математики, совершенно не умеет решать задачи. Это история о том, как красивая метрика обманула исследователя.

Читать далее

ИИ в образовании: заменят ли нейросети репетиторов и преподавателей

Уровень сложностиПростой
Время на прочтение10 мин
Охват и читатели7.2K

Представьте картину маслом: вторник, восемь вечера. Петя, ученик 9-го класса, тупит над квадратным уравнением. Рядом нет репетитора (дорого), родители заняты. Петя открывает ноутбук, заходит в ChatGPT и пишет: «Объясни квадратные уравнения просто, как будто мне 12». Через минуту он получает три разных способа решения, шутку про квадрат и контрольный пример для тренировки. Бесплатно.

А теперь представьте Марию Ивановну, учительницу математики с 30-летним стажем, которая в это же время проверяет тетради и случайно находит у Пети идеально решенную работу. Только вот почерк не Пети, а цифровой.

Вопрос, который мучает Марию Ивановну, Петю, его родителей и инвесторов Кремниевой долины: если нейросети уже умеют объяснять, решать и даже проверять, то зачем через пять лет вообще нужны живые учителя и репетиторы?

Паниковать начали не вчера. Еще в 2023 году исследование Walton Family Foundation показало, что больше половины американских студентов (51%) уже вовсю пользуются ChatGPT для учебы. Учителя тоже не отстают - каждый третий признался, что нейросеть помогает им составлять планы уроков. Российская Вышка докладывает: 2/3 преподавателей хотя бы раз ловили студента на работе, написанной нейросетью. Но те же 40% педагогов считают, что запрещать ИИ бесполезно, надо учить им пользоваться.

Пока чиновники и академики спорят о регулировании, рынок делает свое дело. В приложения вроде Photomath или Socratic от Google льются большие деньги. Идея идеального репетитора, который никогда не устает, не злится и стоит как подписка на кофе, звучит слишком соблазнительно.

Читать далее

Лифт не знает, куда ехать. И это лучший алгоритм, который мы придумали

Уровень сложностиСредний
Время на прочтение7 мин
Охват и читатели28K

Вчера я 4 минуты стоял в подъезде и смотрел, как два лифта одновременно поехали вверх. Все два. На табло — 12, 15, 18. Я на первом. Мне на шестой. И я подумал: вот я кучу лет пишу софт, оптимизирую запросы к базе данных, кеширую всё что движется — а эти две коробки на тросах не могут разобраться, кто из них должен спуститься за мной.

Потом я погрузился в тему. И выяснил, что они не «не могут разобраться». Они математически не способны найти идеальное решение. Вообще никто не способен. Задача диспетчеризации группы лифтов — NP-трудная. То есть буквально: не существует алгоритма, который гарантированно найдёт оптимальный маршрут за разумное время.

И вот уже 60 лет лучшие инженеры мира решают эту задачу эвристиками. По сути — догадками.

Читать далее
1
23 ...