Все потоки
Поиск
Написать публикацию
Обновить
775.37

Машинное обучение *

Основа искусственного интеллекта

Сначала показывать
Порог рейтинга
Уровень сложности

Matrix Reloaded: зачем дата-сайентисту линейная алгебра

Время на прочтение9 мин
Количество просмотров4.1K

Зачем дата-сайентисту векторы, матрицы и собственные значения? В статье Марии Жаровой, ML-инженера Wildberries и автора канала Easy Data, — простое объяснение, как линейная алгебра помогает понимать, что происходит внутри моделей машинного обучения. Без доказательств и зубрежки: только визуализации, реальные кейсы и примеры из практики.

Читать далее

Cache-Augmented Generation против RAG: как ускорить инференс без потери качества

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров3K

Привет, чемпионы! Сегодня расскажу про очень интересную вещь, которая в определенных ситуаций, может быть выгоднее, чем RAG, а также свой опыт в проведении R&D данной технологии и с помощью какой надстройки можно усилить RAG, чтоб прийти к середине между CAG и RAG.

В настоящее время существует множество техник для улучшения качества ответов LLM при работе с частными или корпоративными данными. В этой статье я постараюсь кратко и понятно объяснить:

• что такое CAG

• в каких случаях он действительно применим

• с какими подводными камнями столкнулись мы, а можете и вы при его использовании,

• и какую надстройку можно внедрить в RAG, чтобы приблизиться к эффективности CAG, не теряя гибкости ретривера.

Читать далее

Почему Python стал языком нейросетей и как это работает на практике

Уровень сложностиПростой
Время на прочтение8 мин
Количество просмотров22K

Python давно перестал быть просто «языком скриптов» и уверенно вышел в лидеры среди инструментов для нейросетей. Его синтаксис понятен «с первого взгляда», а мощные библиотеки позволяют сосредоточиться на идее, а не на рутине. Сегодня, от первых численных расчётов в NumPy до сложных моделей в TensorFlow и PyTorch, всё строится вокруг привычного Python-кода. 

В этой статье мы пройдём путь от базовых скриптов до «ручных» нейросетей и ноукод-решений, чтобы понять, почему именно Python стал стандартом в мире ИИ и как с его помощью оживить ваши первые нейросети.

Читать далее

Как я за год в магистратуре погрузился в мир искусственного интеллекта

Время на прочтение7 мин
Количество просмотров7.3K

Привет, Хабр! Меня зовут Алексей Кузин и я стажер в МТС Web Services. В этом материале я расскажу про свой первый год обучения по совместной программе МТС и ВШЭ «Исследования и предпринимательство в искусственном интеллекте». 

Год назад я заканчивал бакалавриат на факультете теоретической физики МИФИ и на последнем курсе познакомился с машинным обучением, которое вскружило мне голову. Но я очень быстро понял, что ML — лишь одна из многих областей искусственного интеллекта и что существует множество других дисциплин и доменов, не менее для меня интересных. 

На рынке есть огромное количество самых разных курсов, но я для себя решил, что хочу системности и структурности в их подаче, а также широты знаний и умений. В первую очередь это позволит самому определиться, в какой конкретной области развиваться профессионально. Поэтому я рассматривал различные варианты магистратуры и в итоге остановился на программе «Исследования и предпринимательство в искусственном интеллекте» от ВШЭ и МТС. В ней меня зацепили объем и новизна учебных материалов, вариативность курсов и очный формат, который позволял общаться с сокурсниками и преподавателями вживую. В этом посте я расскажу, как прошел мой первый учебный год: что понравилось, какие были сложности и что пригодилось на первом месте работы в ИТ. 

Читать далее

Генерация идей для бизнеса и творчества: топ AI-инструментов для брейншторминга

Уровень сложностиПростой
Время на прочтение12 мин
Количество просмотров2.6K

Творческий блок, шаблонные решения, страх ошибиться — традиционный брейншторминг, бывает, превращается в хождение по кругу. А вот AI-ассистенты таким проблемам не подвержены, к тому же они уже давно смогли отойти от шаблонности, и в 2025 году люди всё чаще прибегают к их помощи. ИИ могут не только предлагать варианты, но и критиковать их, комбинировать противоположные концепции и даже предугадывать тренды. Нейросети задают неудобные вопросы, предлагают абсурдные, на первый взгляд, комбинации, но в итоге зачастую именно это и приводит к успеху.

В этой статье вы найдёте подборку инструментов для брейншторминга и их наглядное тестирование, в которое войдёт как генерация идей на определённую тематику, так и решения для более конкретных задач, а в конце будет сравнительная таблица.

Читать далее

Как машинное обучение приручает хаос биологических данных

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров1.1K

Вы когда-нибудь задумывались, сколько тайн скрыто в миллиардах генетических последовательностей, данных о белках и эпигенетических механизмах? А теперь представьте, как алгоритмы преобразуют этот хаос в логичные и работающие модели.

Не так давно алгоритмы в биоинформатике собирались вручную. Сегодня, благодаря машинному обучению, они адаптируются, обучаясь на предоставленных данных, вычленяют низкоуровневые закономерности и формируют абстрактные представления.

Читать далее

Тенденции развития периферийного искусственного интеллекта в автоматизации технологических процессов

Уровень сложностиСредний
Время на прочтение11 мин
Количество просмотров1.2K

Современные промышленные предприятия сталкиваются с необходимостью оптимизации производственных процессов, снижения затрат на обслуживание оборудования и минимизации простоев. Одним из наиболее эффективных подходов к решению этих задач является стратегия прогнозируемого и/или предписывающего обслуживания. В глобальном смысле, прогнозируемое обслуживание (англ. Predictive Maintenance, PdM) является частью стратегии развития промышленного предприятия и стратегии эксплуатации промышленного оборудования, в реализации которой используется дополнительное оборудование, программное обеспечение и новые технологии обработки и анализа данных для обнаружения неисправностей оборудования и устройств с целью их устранения до момента выхода из строя. Важную роль в прогнозированном обслуживании играет применение новых информационных и вычислительных технологий, включая технологии искусственного интеллекта (ИИ). Они позволяют современным предприятиям перейти от реактивного или превентивного обслуживания к прогнозируемому, а в перспективе и к предписывающему обслуживанию[1] [[1], [2]]. В свою очередь, технологии ИИ все чаще используют на периферийных устройствах (Edge AI). Это дает возможность обрабатывать данные непосредственно на диагностируемом оборудовании, значительно ускорить процессы сбора и обработки информации, а также принятия решений. Данный подход снижает зависимость от облачных сервисов и стоимость на владение вычислительной инфраструктурой в целом.

Edge AI — это технология, которая позволяет развертывать и использовать алгоритмы и модели ИИ непосредственно на локальных устройствах, таких как датчики, контроллеры или устройства Industrial Internet of Things (IIoT). В отличие от традиционных подходов, где данные для анализа передаются в облако или производственные центры обработки данных, Edge AI обрабатывает информацию непосредственно на месте, что обеспечивает on-line реакцию на внутренние и внешние изменения и снижает затраты на эксплуатацию.

Читать далее

Используем искусственный интеллект для проектирования информационных систем: от составления ТЗ до прорисовки архитектуры

Уровень сложностиПростой
Время на прочтение26 мин
Количество просмотров4.5K

Всем привет! Сегодня поговорим о GenAI и о том, какую неоценимую помощь он может оказать при проектировании и разработке информационных систем. Мы обсудим, как GenAI может использоваться для этой задачи, с какими трудностями столкнётся и какой результат можно получить.

Рассмотрим процесс проектирования на конкретном примере выполнив серию промптов,а так же проверим как GenAi умеет рисовать диаграммы в форматах UML и Mermaid.

Читать далее

Разбор заданий AI CTF на Positive Hack Days Fest. Часть 2

Уровень сложностиСредний
Время на прочтение19 мин
Количество просмотров1.8K

Всем привет! Публикуем вторую и заключительную часть разбора заданий конкурса AI CTF 2025. Задания этой части повышенной сложности! Приготовьтесь вспоминать, как работают ML-модели и сервисы их использующие. А ещё приоткройте учебник эльфийского ;-)

Читать далее

Искусственный интеллект как часть CRM

Уровень сложностиСредний
Время на прочтение6 мин
Количество просмотров1.9K

Современные компании обрабатывают огромное количество информации, сталкиваясь с необходимостью адаптации к быстро меняющимся условиям рынка, технологическим инновациям и растущим ожиданиям клиентов.

Это подогревает интерес к встроенным инструментам ИИ в составе любого ИТ-решения. Как результат, искусственный интеллект и машинное обучение остаются главным технологическим трендом, а компании-разработчики постоянно совершенствуют инструменты для анализа, прогнозирования и работы с большими массивами данных.

В этой статье мы расскажем, как ИИ помогает пользователям CRM-системы BPMSoft повышать эффективность управления данными, клиентским сервисом и бизнесом в целом.

Читать далее

Кто получит нейро-Оскар: 10 нейросетей для создания видеоконтента

Время на прочтение10 мин
Количество просмотров3.8K

В 2025 году создание видео с помощью искусственного интеллекта стало новым популярным хобби. Рекламный ролик, вирусные новости, ИИ-интервью, коты в стиле Тарковского — нейросети открыли доступ к генерации видео практически без ограничений. А главное, любые видео теперь можно создавать без съемочной группы и навыков монтажа. Нужно всего лишь придумать сценарий ролика и набросать текстовый запрос. Остальное нейросеть сделает самостоятельно.

Редакция блока «М.Клик» собрала наиболее интересные нейросети для создания видео. В приведенной подборке — и любимчики креаторов, и самые свежие новинки.

Читать далее

MCP для новичков

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров13K

Model Context Protocol (MCP) - это просто API, разработанный для LLM. Конечно, LLM могут использовать традиционные API, но это как просить повара готовить в кладовке.

Читать далее

BirdCLEF+ 2025: обзор соревнования и ключевые решения топ-5 команд

Уровень сложностиСредний
Время на прочтение4 мин
Количество просмотров1.1K

BirdCLEF+ 2025 — очередная часть ежегодного соревнования от Cornell Lab of Ornithology по распознаванию звуков дикой природы. В этом году участникам предстало предсказывать целевое животное на коротких фрагментах записи, балансируя между качеством моделей и жёсткими ограничениями железа.

Разобраться в псевдолейблинге...

Ближайшие события

Пеликаны, сарказм и логические игры — забавные LLM-бенчмарки

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров1.2K

Новые нейронки появляются чуть ли не еженедельно и каждая борется за первенство в лидербордах. Но есть и другой способ оценить их — например, с помощью необычных тестов. Мы в beeline cloud подобрали креативные бенчмарки: от рисования птиц на велосипедах до игр в духе логических загадок.

Читать далее

Свой ChatGPT на документах: делаем RAG с нуля

Уровень сложностиСредний
Время на прочтение6 мин
Количество просмотров19K

Всем привет! Наверняка у вас были ситуации, когда нужно быстро найти что-то в длинном документе-договоре, инструкции или отчёте. Сегодня я покажу, как сделать своего помощника, который будет отвечать на такие вопросы автоматически. Соберем RAG с нуля: загрузим документы, "нарежем" их на куски, проиндексируем в векторной базе данных Qdrant и подключим LLaMA.

Если вы увидели незнакомые слова — не пугайтесь, далее я расскажу об этом подробно.

Читать далее

Конфаундинг, или как аналитику попасть в ловушку

Уровень сложностиСредний
Время на прочтение17 мин
Количество просмотров5.2K

Вы построили свою модель: p-value в порядке, R² впечатляет, вот только эффект — мнимый. Причина? Иногда вы упустили какую-то переменную. Иногда добавили лишнюю. Иногда включили ту, которая полностью поменяла ваш вывод. Настало время познакомиться с самым изощрённым убийцей аналитических выводов — конфаундингом.

Читать далее

Исследование METR: использование Cursor замедляет опытных разработчиков на 19 %

Уровень сложностиПростой
Время на прочтение20 мин
Количество просмотров24K

Считается устоявшейся истиной, что инструменты автодополнения кода и прочая помощь от больших языковых моделей помогают программировать быстрее. Исследование организации METR ставит это фактоид под сомнение и даже демонстрирует обратный эффект.

В рамках анализа труда 16 программистов обнаружилось, что ИИ замедляет человека на 19 %. Это противоречит мнению экспертов индустрии машинного обучения, экономистов и самих участников эксперимента. Важно, что проверка шла не на очередных бенчмарках или предложениях решать алгоритмические задачи на скорость, а в обычной работе людей.

Читать далее

Как ИИ учится думать как человек: разбираем крутое исследование про мультимодальные модели

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров6.6K

Недавно в журнале Nature вышла статья, которая заставила нас ахнуть: оказывается, современные нейросети начинают думать о мире почти как люди! Учёные из Китая исследовали, как большие языковые модели (LLM) и мультимодальные модели (MLLM) формируют представления об объектах, и сравнили их с человеческим мышлением. Мы разобрали эту работу и рассказываем вам, почему она реально крутая, простым языком. Погнали!

Читать далее

AutoPrompting: как улучшить промпты, сэкономив время и ресурсы промпт-инженеров

Уровень сложностиСредний
Время на прочтение8 мин
Количество просмотров11K

В этой статье мы говорим об автопромптинге - что это такое, зачем он нужен и как он помогает уже сегодня промпт-инженерам.

Читать далее

Топ вопросов с Data Science собеседований: Основы Classic ML, Линейные модели, Метрики классификации и регрессии

Уровень сложностиПростой
Время на прочтение13 мин
Количество просмотров9.8K

Секрет успешного трудоустройства — в дотошной подготовке к собеседованиям!

Этот материал не рассчитан на изучение тем с нуля. Это чеклист и тренажёр, по которому стоит пройтись перед техническим интервью по классическому ML. Кратко, по делу, с акцентом на то, что действительно спрашивают.

В этой части разберем: основы машинного обучения, переобучение и кросс‑валидация, линейные модели, метрики классификации и регрессии.

Узнать вопросы и ответы на них

Вклад авторов