Обновить
1115.77

Искусственный интеллект

AI, ANN и иные формы искусственного разума

Сначала показывать
Порог рейтинга
Уровень сложности

Надвигается ли третий технологический пузырь века? ИИ-бум в свете доткомов и кризиса 2008

Время на прочтение3 мин
Количество просмотров2.9K

Наверняка многие из вас помнят последствия краха доткомов в 2001 году, или, что ещё хуже, жилищный кризис 2008 года. В обоих случаях инвесторы вложили триллионы в новые, плохо понятные активы — будь то интернет-стартапы, или ипотечные ценные бумаги и их деривативы. Итог — раздутые спекулятивные пузыри и значительный ущерб для экономики после их неизбежного схлопывания.

Сегодня мы, возможно, наблюдаем рождение третьего крупного пузыря в этом веке — пузыря искусственного интеллекта (ИИ).

Читать далее

Что «под капотом» у DeepSeek-V3.2-Exp? Китайцы нашли способ удешевить нейросети

Уровень сложностиПростой
Время на прочтение3 мин
Количество просмотров9.1K

Привет, Хабр! Китай снова выпустил кое-что интересное, так что давайте разбираться. 

Еще в сентябре у китайцев вышла новинка — DeepSeek-V3.2-Exp, экспериментальная версия последней модели DeepSeek-V3.1-Terminus. Цели и задачи у них вполне определенные: сделать архитектуру трансформеров еще более эффективной. Причем на сайте Hugging Face говорится, что особый акцент стартап делает на повышение вычислительной эффективности при обработке длинных текстовых последовательностей. 

Читать далее

EvoPress: новый подход к оптимизации и сжатию LLM от исследователей Яндекса

Уровень сложностиСредний
Время на прочтение8 мин
Количество просмотров3.3K

Всем привет! Меня зовут Денис Кузнеделев, я работаю в команде Yandex Research. Моё основное направление деятельности на данный момент — задача сжатия и ускорения больших языковых и картиночных моделей. Затраты на обучение, инференс и деплой LLM стали одной из ключевых инфраструктурных проблем индустрии: дефицит вычислительных ресурсов, нехватка видеопамяти и высокие требования языковых моделей к вычислительным ресурсам препятствуют масштабированию решений. 

Сегодня я расскажу о методе неравномерного сжатия нейронных сетей EvoPress, который мы предложили совместно с коллегами из ETH Zurich и представили в июле этого года на одной из ведущих конференций по машинному обучению — ICML.

Читать далее

Шопинг-терапия 2.0: Как ИИ мог бы лечить тревогу, не опустошая кошелек клиента

Время на прочтение5 мин
Количество просмотров372

Привет, Хабр! В этой статье я решила разобрать, как шопинг-терапия может превратиться из пустой траты денег в инструмент этичного ретейла с помощью ИИ, потому что за более чем 20 лет в CX-решениях я убедилась: стресс и тревога — это не просто «личное», а огромная проблема для бизнеса, вызывающая импульсивные покупки и последующие возвраты.

Совместив математический анализ поведенческих паттернов с психологией стресса, мы можем создать виртуальногои помощника, который позаботится о кошельке клиента, не опустошая его — и повысит лояльность к бренду.

На связи Елена Орлова, директор по стратегическому развитию портфеля продуктов «Авандок» в компании «КОРУС Консалтинг».

Читать далее

Как создать AI-агента и дать ему инструменты

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров7.1K

Тема применения сервисов GenAI сейчас на хайпе, на конференциях по этой теме всегда аншлаг, а подавляющее большинство пользователей «играется» с текстовыми запросами в бесплатных сервисах, восторгаясь полученными результатами.

В этой статье хочу пойти дальше и определиться с понятием AI-агентов и показать пример создания AI-агента с помощью системы n8n.io и популярных сервисов GenAI.

Перейти к статье

ИИ для технической и пользовательской документации. Какие нейросети помогут

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров2.7K

Любая человеческая деятельность, любой проект порождает информацию. Ей нужно делиться, но не всей. Желательно обработать поток данных, прежде чем предоставить его кому-то. На этом принципе построено любое обучение, вербальное и даже невербальное взаимодействие — тот, кто отправляет информацию, учитывает возможности и особенности того, кто её принимает.

Читать далее

Программисты получают 2,8 млн. в год и разработка всё равно дорожает. Как это остановить

Уровень сложностиПростой
Время на прочтение12 мин
Количество просмотров22K

Привет, Хабр!

«Разработчики исчезнут, но не все» — когда я услышал эту фразу в дискуссии на канале Dev Q&A, она засела в голове надолго. Вот факт: за 10 лет средняя зарплата разработчика в России выросла с миллиона до 2,8 миллиона рублей в год. Стоимость часа работы — с $30-50 до $80-100, у крупных агентств доходит до $300-400. И это происходит как раз тогда, когда появились ИИ-ассистенты, low-code платформы и масса других инструментов, которые вроде бы должны всё удешевлять.

Читать далее

Как добавить AI-ревью и ответы ассистента в Pull Request всего за 30 минут

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров3.4K

В этом материале я покажу, как всего за 30 минут встроить в ваш CI/CD пайплайн полноценное AI-кодревью и ассистента на базе открытого инструмента AI Review — без платных API и лишней инфраструктуры.

Читать далее

Как научить ИИ говорить по делу: короткие рабочие приёмы

Время на прочтение4 мин
Количество просмотров2.9K

Общение с ChatGPT или другими нейросетями часто превращается в охоту за смыслом. Вместо прямого ответа вы получаете длинное полотно — с комплиментами, философией и случайным рецептом оладий. А нужная информация где-то посередине. Узнаёте? В этой статье разберём, как сделать так, чтобы ИИ писал коротко и по делу.

Читать далее

Разбираемся с Нобелевкой по экономике, а также миллиардное дело о пиратстве OpenAI

Время на прочтение9 мин
Количество просмотров7.9K

Самые интересные новости финансов и технологий в России и мире за неделю: серебро и золото продолжают ставить рекорды, JPMorgan боится тараканов, принудительное гашение четырех фондов Тинькофф, новый самый молодой миллиардер, США раздумывают над спецоперацией в Венесуэле, ChatGPT снимет ограничения на эротику, а роботов Илона Маск не могут дособирать (потому что у них нет лапок).

Читать далее

ТОП-12 бесплатных сайтов и онлайн инструментов для генерации изображений в 2025 году

Уровень сложностиПростой
Время на прочтение10 мин
Количество просмотров20K

Генерация изображений нейросетями стала «обычной кнопкой» рядом с привычными инструментами дизайна. Сегодня можно создать картинку по описанию на русском языке, прямо в браузере, часто без регистрации и, что важно, — бесплатно. Такой «free image generator» полезен не только дизайнерам: предприниматели собирают карточки товара и hero-баннеры, SMM-специалисты — креативы и сторис, журналисты и блогеры — иллюстрации к материалам, разработчики — прототипы интерфейсов и игровые мокапы.

Почему эта тема так «зашла»?

Читать далее

RL (RLM): Разбираемся вместе

Уровень сложностиСредний
Время на прочтение12 мин
Количество просмотров1.7K

Всем привет! Недавно я познакомился с курсом по глубокому обучению с подкреплением от HuggingFace Deep Reinforcement Learning Course и захотел сделать выжимку самого интересного. Эта статья — своего рода шпаргалка по основам Reinforcement Learning (RL) и одному из ключевых алгоритмов — PPO, который лежит в основе тонкой настройки современных LLM (Large Language Models).

Читать далее

Как роботы начинают учиться гораздо быстрее

Время на прочтение3 мин
Количество просмотров2.5K

ИИ в робототехнике за последние годы сделал огромный скачок, но все равно попадает в ловушки повседневности. В лаборатории всё работает идеально, а на фабрике или в квартире робот вдруг не справляется с элементарными задачами. Почему современные алгоритмы так часто буксуют, когда сталкиваются с реальностью?

Свежий взгляд на проблему предложили исследователи из Оксфорда. Их главный аргумент звучит достаточно просто: секрет не только в мощности железа или объёме данных, а в том, КАК построено обучение. Роботы начинают учиться быстрее людей не потому, что повторяют наши инструкции, а благодаря гибким методам, которые учитывают шумные сенсоры, разные задачи и даже вмешательство человека по ходу работы.

В этом обзоре расскажу о том, как современные роботы осваивают незнакомые задачи за часы, почему объединение данных, грамотных алгоритмов и понятных инструментов меняет всю индустрию, и самое главное — к чему это приведёт нас в ближайшем будущем.

Читать далее

Ближайшие события

Новые правила для GPAI и «каскад обязанностей»: как небольшой команде превратить риски EU AI Act в преимущество

Уровень сложностиСредний
Время на прочтение10 мин
Количество просмотров306

Недавно опубликованные Еврокомиссией требования к моделям общего назначения (GPAI) по Закону ЕС об ИИ (EU AI Act)  задают правила игры для всех, кто работает с генеративным ИИ. Даже если вы — небольшая команда, которая интегрирует в свой продукт API от OpenAI, использует Llama или любую другую foundation model, эти новые нормы касаются вас напрямую как Деплоер.

Важно понимать: речь не о том, чтобы отвечать за ошибки Google или Anthropic. Речь о том, что у Деплоера появляется своя, отдельная зона ответственности. Но для небольшой и гибкой команды это не только новые риски, но и уникальная возможность. В этой статье мы посмотрим на проблему с точки зрения небольшой компании разрабатывающей свой ИИ продукт и  разберем, что входит в эту зону ответственности и, самое главное, как использовать новые обязанности «больших компаний» как рычаг для построения более надежного и конкурентоспособного продукта.

Читать далее

Как шаблоны рассуждения учат ИИ думать: новая эпоха Pattern-Aware Learning (PARO)

Уровень сложностиСредний
Время на прочтение5 мин
Количество просмотров1.2K

TL;DR: В работе «Reasoning Pattern Matters: Learning to Reason without Human Rationales» авторы показывают, что для шаблонных задач рассуждения (patterned reasoning) ключ к качеству — не объём и не безупречность «рационалей», а явное усвоение шаблона рассуждения. Они демонстрируют это на двух финансовых задачах (NSM и TPC), вводят метрику/анализ «развилочных токенов» и предлагают PARO — способ автоматически генерировать рационали, следуя заранее заданному шаблону. Итог: SFT+RLVR, обученное на 10× меньшем количестве человеческих рационалей или частично «испорченных» рационалях, почти не теряет в качестве; а рационали, сгенерированные PARO, сопоставимы с крупными человеческими наборами.

Читать далее

Завайбкодил за 4 часа AI дневник питания и перестал пользоваться OURA

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров4.5K

Иногда хочешь просто записать, что поел — а заканчиваешь тем, что делаешь новый AI-продукт. Так я за вечер завайбкодил бота, который анализирует еду по фото, даёт советы и чувствует себя умнее, чем мой OURA Ring за $450.

Читать далее

Внутренние представления интерактивных мировых моделей

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров1K

Вы не задумывались, почему у нас уже есть Sora/Veo и бесконечный поток нагенерированных роликов, но "Матрица" интерактивных миров где можно действовать всё ещё есть только в лабораториях? Разбираем, что мешает получить 24 FPS интерактивного видео на флагманской видеокарте, как модели запоминают мир и зачем им обучаемое сжатие контекста.

Читать далее

К сожалению, микробиом не исправить краткосрочной отладкой питания

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров2.4K

Пару раз в неделю я выпускаю материалы, в которых проводятся ясные и четкие корреляции между состоянием ЖКТ и работой мозга. Вплоть до разработки рациона, подавляющего болезнь Альцгеймера. Микробиом – приоритетная цель, так как биоразнообразие колоний коррелирует и с отсутствием ожирения, и с успешным метаболизмом нейромедиаторов. Вот только не стоит надеяться, что пара «здоровых завтраков» или выпитые 2-3 бутылочки йогурта радикально и надежно пофиксят микробиом.

Читать далее

Для Кремниевой долины наступила эра «хард-тека»

Время на прочтение7 мин
Количество просмотров11K

Попрощайтесь с эпохой потребительских сайтов и мобильных приложений. Искусственный интеллект положил начало эре, которую инсайдеры из инновационной столицы страны именуют «хард-теком».

Читать далее

Внутри vLLM: Анатомия системы инференса LLM с высокой пропускной способностью

Уровень сложностиСложный
Время на прочтение34 мин
Количество просмотров4.3K

Привет! Этот пост — перевод очень хардовой статьи про внутренности vLLM и того, как устроен инференс LLM. Переводить было сложно из-за англицизмов и отсутствия устоявшегося перевода многих терминов, но это слишком классная статья, и она обязана быть на русском языке! А дальше — слово автору:

От paged attention, непрерывного батчинга, кэширования префиксов , specdec и т.д. — до мульти-GPU и мультинодового динамического сервинга LLM под нагрузкой.

В этом посте я постепенно представлю все основные системные компоненты и продвинутые функции, которые составляют современную систему инференса LLM с высокой пропускной способностью. И детально разберу, как внутри работает vLLM.

Читать далее

Вклад авторов