Обновить
725.8

Машинное обучение *

Основа искусственного интеллекта

Сначала показывать
Порог рейтинга
Уровень сложности

Личное облако на Proxmox, нейронки, LLM и embedding

Уровень сложностиСредний
Время на прочтение15 мин
Количество просмотров479

В прошлой статье я описывал как построить сетевую часть самодержавного сервера, пора принести в него что-то отдаленно разумное. Это руководство описывает весь процесс: от подготовки хоста Proxmox и настройки LXC-контейнера до поиска, конвертации и запуска embedding-моделей (на примере BAAI/bge-large-en-v1.5) с использованием Intel GPU для работы модели. Но будет легко запустить не одну модель или полноценного чатбота на этой основе. Главное, что будет ясно как использовать даже простое имеющееся железо домашнего сервера для этого.

Читать далее

Новости

Бустим Transformer-модель через адаптивную TSCO-архитектуру

Уровень сложностиСредний
Время на прочтение12 мин
Количество просмотров146

Как я получил Perplexity~26 на сверхмалой модели трансформерного типа собственной разработки (16M параметров, сверхмалый датасет) на тестовом корпусе и выжал Val Accuracy~0.982 на временных рядах (физических данных, EEG).

Читать далее

Как ИИ-агенты научились рефакторить код: что получается хорошо, а что не очень

Время на прочтение3 мин
Количество просмотров541

ИИ-агенты берут на себя задачи по улучшению кода, исправлению ошибок и даже автоматической отправке pull request’ов. Эти агенты также обещают значительно ускорить рефакторинг. 

Недавнее исследование показало, что современные ИИ-агенты хорошо исправляют код с типовыми улучшениями, но почти не трогают код, требующий улучшения архитектуры или исправления сложного технического долга. Также выяснилось, что ИИ мало дать большое количество данных и простые инструкции для существенного улучшения производительности, ему также нужны механизмы рассуждений и встроенные инструменты. 

В этом обзоре мы обсудим текущие возможности ИИ-агентов для рефакторинга, как их подход отличается от человеческого, и что может привести к следующему скачку производительности. Всё это повлияет на то, как мы будем работать с кодом и распределять задачи между людьми и машинами.

Читать далее

Как ИИ-агенты объединяются в рой, управляют устройствами и предсказывают желания — топ-10 исследований за октябрь 2025

Время на прочтение16 мин
Количество просмотров539

В прошлом месяце разработчики создали рой из десятков ИИ-агентов, которые учатся друг у друга, видят мир вашими глазами, управляют устройствами, общаются «мыслями» вместо слов, а также помогают врачам и ученым. Теперь агенты самостоятельно обучаются работе с интерфейсами по видео из YouTube и общаются «мыслями» вместо слов.

Это обзор главных исследований в области ИИ за октябрь 2025-го — читайте далее, чтобы понять, куда реально движется развитие искусственного интеллекта.

Читать далее

Как прокачать ИИ-агента без дообучения: Agent Skills

Уровень сложностиСредний
Время на прочтение7 мин
Количество просмотров311

Большие языковые модели давно вышли за пределы «болталок» и теперь работают в реальных средах — пишут код, анализируют данные, управляют инструментами. Однако чем мощнее становятся такие агенты, тем отчётливее видно: дело уже не в нейросетевых весах, а в доступе к структурированным знаниям и процедурному контексту. Anthropic предлагает ответ в виде Agent Skills — модульного подхода, позволяющего упаковывать экспертизу в обычные папки и файлы, которые агент может обнаруживать, подгружать и использовать динамически. Это попытка превратить LLM из универсального помощника в специалиста без дообучения и одновременно найти масштабируемый способ работать с контекстом за пределами токенов.

Читать статью

Как LinkedIn масштабировал поиск людей на 1,3 млрд пользователей

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров338

LinkedIn запускает обновлённый поиск людей на базе генеративного ИИ — и делает это спустя, казалось бы, удивительно долгую паузу для функции, которая напрашивалась сама собой. Появление новой системы происходит три года спустя после выхода ChatGPT и через полгода после запуска ИИ-поиска вакансий в LinkedIn.

Для технических руководителей это — наглядный урок: внедрение генеративного ИИ в настоящих корпоративных условиях, да ещё в масштабе 1,3 млрд пользователей, — процесс медленный, тяжёлый и требующий постоянной прагматичной оптимизации.

Читать далее

Простой Python, автоматический Spark: минус Kubernetes, плюс продуктивность

Время на прочтение13 мин
Количество просмотров534

Установка и эксплуатация приложений Spark в облаке зачастую становятся препятствием для дата-инженеров (Data Engineer, DE): сложная работа с Helm-конфигурациями отвлекает внимание от анализа данных и замедляет подготовку среды. Но полностью отказываться от Spark зачастую нерационально, поэтому многие команды стремятся найти свое решение для обхода существующих сложностей.

Привет, Хабр. Меня зовут Юрий Орлов. Я руководитель команды разработки ML Platform в VK Tech. В этой статье я расскажу о том, как мы автоматизировали развертывание Spark в облаке и создали клиент на Python, который снижает требования к знаниям в области DevOps и Kubernetes, необходимым для начала работы со Spark.

Читать далее

Как работают ИИ-агенты и кому они на самом деле нужны

Время на прочтение9 мин
Количество просмотров3.6K

ИИ-агенты — одна из самых обсуждаемых технологий сегодня. Отчеты называют их революцией, а новостные заголовки — заменой сотрудникам. Но за громкими заявлениями часто теряется главный вопрос: как именно это работает для бизнеса уже сейчас?

Составили полноценный обзор: чем ИИ-агенты отличаются от привычных чат-ботов, каким проектам они приносят реальную выгоду и как оценить, готова ли ваша компания к первому пилоту. А еще подготовили простой гайд, чтобы каждый смог попробовать, что такое ИИ-агент на самом деле. 

Читать далее

Boomerang hires: почему компании возвращают сотрудников, которых сократили ради ИИ

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров2.3K

На волне инвестиций в ИИ многие корпорации сократили штат, рассчитывая заменить людей цифровыми работниками. Но данные HR-аналитики показывают обратный тренд: растет доля "boomerang hires" - бывших сотрудников, которых компании вынуждены нанимать обратно. Разбираем, что пошло не так: завышенные ожидания от автоматизации, недооценка совокупной стоимости владения ИИ и скрытые издержки увольнений.

Читать далее

Маркетинг или аналитика? Что не так с отчётом Anthropic о кибершпионаже

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров319

Команда AI for Devs подготовила перевод статьи о том, почему свежий отчёт Anthropic о «кибершпионаже с помощью ИИ» вызывает больше вопросов, чем даёт ответов. Автор критикует отсутствие технических деталей, IoC и доказательной базы, а сам документ считает больше маркетинговым, чем аналитическим.

Читать далее

Дайджест препринтов научных статей в области Информатики

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров715

Свежая подборка ключевых препринтов научных статей в области Информатики, опубликованных на arXiv.org.

Данный дайджест охватывает передовые и высокоспециализированные исследования, которые формируют научный авангард IT-индустрии.

Материалы затрагивают вопросы верификации систем, основанных на машинном обучении, сравнительный анализ архитектур FPGA и GPU для специализированных вычислительных задач, а также глубокие темы в области языков программирования — от всенаправленного вывода типов до линейности в функциональных Core-языках.

Читать далее

Какой Ai-шник нынче нужон?! / Исследование ИИ рынка труда РФ

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров6.6K

Последние полгода ловлю море статей о том, как направление AI будто бы стремительно растёт, специалистов нужно огромное количество, и платят много и без лишних вопросов. Долго думал, как можно проверить все эти заявления не через абстрактные «экспертные мнения», а на реальных и доступных каждому данных.

В итоге словил простую эврику: «Почему бы просто не залезть на HH и не посмотреть, кого действительно ищут и в каком количестве?»

Спустя пару недель сбора и разметки данных я готов показать небольшое исследование отечественного рынка вакансий, связанного с искусственным интеллектом.

Читать далее

Пример реализации агентного RAG'а

Время на прочтение13 мин
Количество просмотров4K

Многие знают, что такое RAG. Ну, или по крайней мере слышали о нем :) Но не все знают, что типичная архитектура RAG способна отвечать далеко не на все вопросы. У агентного RAG в этом плане гораздо больше возможностей. Агентный RAG может анализировать запрос, составлять план действий и вызвать внешние инструменты. И все это для выполнения поставленной задачи.

В этой статье на практическом примере разберем как с помощью marker'а, Qwen3-14B, MCP-сервера, энкодера FRIDA и библиотеки Agno создать несложный агентный RAG.

---------------

Мои курсы: Разработка LLM с нуля | Алгоритмы Машинного обучения с нуля

Читать далее

Ближайшие события

RAG+Ragas: учим AI-помощника учить без галлюцинаций

Время на прочтение8 мин
Количество просмотров2.5K

Представьте ситуацию: вы прошли онлайн-курс, начинаете применять знания на практике, но что-то не получается и надо вернуться в учебные материалы, найти, где про это что-то рассказывали. Что будете делать: пролистывать все уроки (а их может быть пара десятков), писать куратору (а он может ответить через сутки)?

Мы решили облегчить путь и сделали AI-помощника, который знает все про наши онлайн-курсы. Он ответит на любой вопрос по содержанию уроков, пояснит непонятный момент в процессе обучения и сориентирует, где говорили на тему, которую надо освежить. На все, что не касается курсов или выделения ресурсов для практических заданий, продолжают отвечать кураторы.

Дальше расскажу, почему мы проверяем ответы помощника с Ragas и с какими нюансами столкнулись в процессе. Но начну с архитектуры, чтобы показать, как Ragasсвязан с RAG.

Читать далее

GPU Intel Arc на Raspberry Pi и non-x86 платформах — запуск, настройка и анализ производительности

Уровень сложностиСредний
Время на прочтение8 мин
Количество просмотров1.5K

Наконец‑то удалось достичь значительного прогресса в работоспособности графических процессоров Intel Arc на платформах Raspberry Pi. Система работает относительно стабильно. После преодоления множества технических препятствий появилась реальная перспектива интеграции этих GPU в официальную Raspberry Pi OS. В случае успеха, для активации карт Intel пользователям потребуется лишь установить соответствующий пакет прошивок.   

Важность этого достижения выходит далеко за рамки экосистемы Raspberry Pi.

Программный патч, необходимый для работы карт Arc, запускает их не только на архитектуре Arm, но и на всех системах, не относящихся к x86, включая RISC-V. Сейчас Arm-платформа Raspberry Pi выступает в роли доступной и популярной тестовой площадки для решения фундаментальной задачи совместимости.

Успешная интеграция драйвера Intel Xe в ядро Linux для non-x86 архитектур открывает всей линейке Intel Arc доступ к экосистеме RISC-V. Не забываем, что та испытывает острую нехватку мощных GPU с открытыми драйверами.

Читать далее

Современные OCR для сложных документов: сравниваем 6 open-source моделей на реальном кошмаре инженера

Уровень сложностиСредний
Время на прочтение6 мин
Количество просмотров7.6K

Привет, Хабр! Каждый, кто хоть раз пытался вытащить данные из скана акта или старого отчета, знает эту боль. Классические OCR-инструменты, вроде старого доброго Apache Tika, отлично справляются с простым печатным текстом, но пасуют перед реальными вызовами: таблицами со сложной вёрсткой, рукописными пометками, мелким курсивом и разными шрифтами в одном документе.

Чтобы не быть голословными, давайте посмотрим на типичный «сложный» документ и что с ним делает Tika.

Читать далее

Как написать собственные классы классификации для маленьких

Уровень сложностиСредний
Время на прочтение5 мин
Количество просмотров1.6K

В прошлый раз я уже рассказывала о том, как в ходе обучения в "Школе 21" создавала класс линейной регресии, на этот раз будем рассматривать реализацию LogisticRegression, GaussianNB, KNN. Как и в прошлый раз, минимум теории, максимум практики.

Читать далее

Как универсальный ИИ-агент учится жить в открытом мире

Время на прочтение6 мин
Количество просмотров971

ИИ уже давно обыгрывает людей в сложные игры вроде шахмат и Dota 2. Однако, стоит поместить их в менее структурированные неигровые или даже игровые цифровые миры, как их работоспособность резко снижается. Например, одна и та же модель, которая эффективно работает на фиксированных целях, может казаться совершенно беспомощной, если цели меняются и агенты должны сами понимать, как их достичь.

Недавние исследования показывают, что агенты все еще далеки от идеального поведения в открытых средах, при этом размер модели и архитектурные ухищрения играют меньшую роль, чем считалось ранее. Все большее значение приобретает способность агентов использовать мышление. В этой статье мы рассмотрим Lumine —  агента, который способен выживать в большом мире, продуманно выбирая действия и обучаясь на своем опыте.

В обзоре расскажу, почему для агентного ИИ важно не только копировать действия игроков, но и осваивать  особое гибридное планирование и обучение, а также размышлять только тогда, когда это необходимо.

Читать далее

Собираем простейшую RAG-систему на PHP с фреймворком Neuron AI за вечер

Уровень сложностиСредний
Время на прочтение15 мин
Количество просмотров4.7K

RAG (Retrieval‑Augmented Generation или генерация, дополненная поиском) — это метод искусственного интеллекта, сочетающий генеративную большую языковую модель (LLM) с внешней базой знаний для создания более точных, контекстно‑зависимых и актуальных ответов. Принцип его работы заключается в том, что сначала извлекается релевантная информация из набора документов или источников данных, а затем эта информация передается в LLM для формирования окончательного ответа. Этот процесс позволяет модели выдавать более точные ответы, менее подверженные «галлюцинациям», и ее можно обновлять без дорогостоящего переобучения.

Сегодня мы разберёмся, как собрать базовую RAG‑систему на PHP (да, да, не надо удивляться) с помощью фреймворка Neuron AI. Это будет наш маленький proof‑of‑concept — минимально работающий, но вполне реальный пример.

Ну что, начнём генерацию?

Читать далее

Создаем мощного ИИ-агента с долговременной памятью, используя LangGraph, RAG и веб-скрапер

Уровень сложностиПростой
Время на прочтение10 мин
Количество просмотров5.1K

В этой статье я поделюсь с вами очень быстрым руководством, которое покажет, как создать мультиагентного чат-бота с использованием LangGraph, RAG и долговременной памяти для создания мощного чат-бота-агента для вашего бизнеса или личного использования.

Читать далее
1
23 ...

Вклад авторов