Все потоки
Поиск
Написать публикацию
Обновить
798.84

Машинное обучение *

Основа искусственного интеллекта

Сначала показывать
Порог рейтинга
Уровень сложности

Когда несколько пикселей решают всё: One Pixel атака и способы защиты от неё

Уровень сложностиСредний
Время на прочтение13 мин
Количество просмотров11K

Удивительно, но факт: несколько изменений в изображении могут полностью поменять вывод нейросети, что ломает заложенную разработчиком логику. В данной статье мы не просто подсветим факт существования One Pixel атаки, но и комплексно разберём архитектурные факторы, которые влияют на устойчивость CV-систем к данному семейству атак.

Читать далее

Персональный сверхинтеллект: обращение Марка Цукерберга

Время на прочтение3 мин
Количество просмотров1.9K

Интервью (https://www.meta.com/superintelligence/) главы Meta, Марка Цукерберга. Meta — страшно запрещенная в России нежелательная организация.

За последние несколько месяцев мы начали замечать проблески того, как наши ИИ-системы начали улучшать сами себя. Пока это улучшение медленное, но его наличие неоспоримо. Создание сверхинтеллекта уже на горизонте.

Кажется очевидным, что в ближайшие годы ИИ улучшит все наши существующие системы. Он позволит создавать и открывать новое, доселе невообразимое — уже сегодня. Остаётся открытым лишь вопрос, на что мы направим усилия сверхинтеллекта...

Читать далее

Нейро-дайджест: ключевые события мира AI за 4-ю неделю июля 2025

Уровень сложностиСредний
Время на прочтение8 мин
Количество просмотров2.4K

Привет! Это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта и технологий.

Неделя выдалась интересной: Qwen показала мощные обновления линейки и модель для кодинга, OpenAI открыла ChatGPT Agent для всех подписчиков, а Figma научилась в один клик собирать полноценные сайты. Маск запускает суперкомпьютер Colossus 2, а подростки меняют ИИ на друзей.

Всё самое важное — в одном месте. Поехали!

Читать дайджест

Использование YandexGPT через Siri

Время на прочтение4 мин
Количество просмотров1.3K

В данной статье я расскажу как добавить YandexGPT для использования с Siri с помощью приложений Shortcuts и Scriptable.

Читать далее

Восприятие и навигация для мобильных роботов

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров861

Мобильные роботы стремительно проникают в быт и деловую среду. Их все чаще используют для уборки дома, управления складом, работы в опасных зонах и даже исследования космоса. Например, в 2024 году рынок мобильных роботов составил 21,6 млрд долларов, а к 2032 году его размер может вырасти до 43,9 млрд долларов. 

Читать далее

Xe vs He: кого брать-то?

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров1.6K

Xavier vs He: Как правильно 'разогнать' нейросеть перед стартом. Визуализации и эксперименты.

Вы ставите Linear(128, 256) в PyTorch. Выбор initializer'а — дело 5 секунд. Но от него зависит, сойдется ли ваша сеть за 10 эпох или не обучится вообще. Че делать-то?

Читать далее

Microsoft и расстрельный список профессий

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров2.8K

Заменит ли ИИ табя на работе? Пока мы бросаемся заявлениями в чате, из Microsoft Research сделали то, что и положено делать в приличном обществе - посмотрели на данные. Публикация есть на Архиве. Давайте отбросим хайпожорство в стиле Крола и посмотрим, что и почему пишет Microsoft.

Они залезли в 200 тысяч анонимных диалогов с Copilot и выяснили, для чего люди используют их нейронку. Это не какие-то там гипотезы, это суровая реальность. Пусть Copilot не самый популярный ИИ-ассистент, но пользователей у него есть в количестве. Исследование сделано под эгидой министерство труда США, и у них есть какие-то подробные данные о рынке.

В каждом диалоге есть две параллельные реальности...

Читать далее

Геоданные VS медицина. На чем строить ГИС анализ в здравоохранении в 2025 году?

Уровень сложностиПростой
Время на прочтение10 мин
Количество просмотров547

Геоаналитика VS медицина: могут ли карты спасать жизни людям?

COVID-19 научил нас главному: болезни распространяются не по документам, а по реальным улицам и домам. Геоаналитика — это не только про картинки, но и про задачи. Я 5 лет превращаю медицинский хаос в цифры и карты — и вот что я понял и решил поделиться с Хабром.

Почему так — читаем

Retrieval-Augmented Generation (RAG): глубокий технический обзор

Время на прочтение34 мин
Количество просмотров11K

Retrieval‑Augmented Generation (RAG) — это архитектурный подход к генеративным моделям, который сочетает навыки поиска информации с генеративными возможностями больших языковых моделей (LLM). Идея RAG была предложена в 2020 году, чтобы преодолеть ограничение LLM — замкнутость на знаниях из обучающих данных. Вместо попыток «вживить» все знания в параметры модели, RAG‑подход позволяет модели запрашивать актуальные сведения из внешних источников (баз знаний) во время генерации ответа. Это обеспечивает более точные и актуальные ответы, опирающиеся на факты, а не только на память модели.

В этой статье мы подробно рассмотрим: архитектуру RAG, её компоненты и этапы работы, современные инструменты и практики для реализации RAG, примеры кода на Python, кейсы применения в бизнесе и науке, технические вызовы и лучшие практики, сравнение RAG с классическим fine‑tuning, перспективы технологии.

Читать далее

7 кругов ада: практический гид по выбору стека для ML-разработки

Уровень сложностиСредний
Время на прочтение16 мин
Количество просмотров7.1K

Сколько раз за последние пару-тройку вы меняли свой AI/ML стек? Если ответ «ни разу» — либо у вас железная дисциплина, либо вы просто не следите за тем, что происходит в индустрии. McKinsey Global Survey показывает, что adoption AI вырос с 50% до 72% только за последний год. Это означает, что пока вы размышляете над выбором между PyTorch и TensorFlow, ваши конкуренты уже запускают production-модели на совершенно других стеках. 

Проблема не в том, что инструментов мало — а в том, что их чертовски много. Современный ML/AI стек превратился в слоеный пирог из семи уровней: от ИИ-инфраструктуры в самом низу до слоя ИИ-решений наверху. Каждый уровень предлагает десятки вариантов, от которых глаза разбегаются даже у матерых разработчиков, но хаос поддается систематизации. В этой статье мы расскажем о любимых инструментах, препарируем популярные решения, и разберемся, как выбрать стек, который не превратится в тыкву через полгода. 

Читать далее

60 открытых уроков августа: от C++ и Swift до аналитики и DevSecOps

Уровень сложностиПростой
Время на прочтение3 мин
Количество просмотров853

Если вы давно хотели разобраться с CI/CD, научиться запускать высоконагруженные API или наконец-то понять, как работают трансформеры в ML — вам сюда. В августе мы проведем 60 открытых уроков по ключевым темам разработки, архитектуры, безопасности, тестирования, анализа и управления.

Каждое занятие — это новые знания и практический разбор задач, возможность задать вопросы экспертам и оценить, нужно ли вам более серьёзное систематическое обучение. Выбирайте свою тему и записывайтесь.

Читать далее

Неделя в российском AI: от управления «мыслями» нейросетей до победы человека над ИИ

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров603

Собрали главные события недели с 21 по 26 июля 2025 года в российском AI-сегменте: технические прорывы, корпоративные внедрения и неожиданные результаты соревнований человека с машиной.

Читать далее

Как собрать ИИ-агента — открытые руководства для чтения

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров8.9K

ИИ-агенты — одна из относительно новых и обсуждаемых тем в технологической индустрии. Все больше компаний развивают решения, способные не только отвечать на вопросы и поддерживать беседу, но и взаимодействовать с операционной системой, приложениями и веб-сайтами: автономно решать комплексные задачи.

Мы в Beeline Cloud подобрали несколько профильных материалов для тех, кто хочет познакомиться с темой, разобраться в устройстве современных ИИ-агентов и (возможно) разработать собственную систему подобного типа.

Читать далее

Ближайшие события

RTX 4090 или L40S: оптимальный GPU среднего уровня в 2025 году

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров4.1K

Привет! На связи команда mClouds. В 2025 году разработчики AI-проектов сталкиваются с непростым выбором: использовать потребительскую видеокарту RTX 4090 или профессиональное решение L40S. Обе карты построены на архитектуре Ada Lovelace, используют один и тот же графический чип AD102 и имеют похожую вычислительную мощность, но L40S предлагает вдвое больше памяти: 48 ГБ против 24 ГБ у RTX 4090.

В этой статье мы детально сравним технические характеристики, производительность и практическую применимость этих карт для различных задач. 

Читать далее

Что такое ИИ-агенты: как работают и почему они важны

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров8.2K

ИИ-агент — это интеллектуальная система, способная не только отвечать на запросы, но и самостоятельно ставить цели, планировать действия и адаптироваться в процессе. В отличие от традиционных чат-ботов, выполняющих строго заданные команды, агент действует автономно, подобно виртуальному сотруднику. Получив задачу, он разбивает ее на этапы, подбирает инструменты (базы данных, API, сторонние программы), анализирует результат и корректирует стратегию при необходимости.

Читать далее

10 промптов для ChatGPT и других ИИ, которые помогут трезво взглянуть на вещи

Уровень сложностиПростой
Время на прочтение3 мин
Количество просмотров24K

Нейросети плотно вошли в жизнь почти каждого, помогая как в работе, так и в личных делах. Но у современных моделей есть одна черта, которая вредит в некоторых ситуациях — они неисправимые оптимисты и подхалимы. Конечно, здорово, когда каждую вашу идею хвалят и поддерживают, но иногда полезен и трезвый взгляд.

Я регулярно пользуюсь промптами, которые помогают разобрать любой вопрос, проблему и идею на составляющие части, а затем критически посмотреть на них. Ниже — подборка из 10 промптов, которые работают лучше всего.

Читать далее

Если нужно сгенерировать синтетические данные — подборка открытых решений

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров1.9K

Про снижение расходов на работу с данными расскажем 13 августа на вебинаре. А сегодня мы поговорим об открытых инструментах, которые открывают новые возможности для экспериментов и работы с ML. Далее в подборке четыре решения по теме — разбираем их возможности и примеры использования.

Читать далее

Топ-5 бесплатных нейросетей для транскрибации: лучшие сервисы для перевода аудио в текст

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров33K

Нас давно не удивишь тем, что нейросеть за пару секунд расшифровывает двухчасовую лекцию или превращает аудиозаметку в аккуратный текст с заголовками и абзацами. Мы живём в эпоху, где слова больше не нужно набирать вручную. Их достаточно просто произнести, а остальное за алгоритмами.

Сегодня мы решили проверить, как работают пять популярных нейросетевых помощников для перевода аудио в текст. И сделаем это необычным способом через сказки!

Заинтересовали? Тогда давайте расшифровывать, сравнивать и делиться впечатлениями вместе.

Приятного прочтения!

Читать далее

Когда две головы лучше, чем одна: ученые экспериментируют с коллективной работой нейросетей

Уровень сложностиСредний
Время на прочтение6 мин
Количество просмотров1.4K

Сегодня я хочу рассказать о японском стартапе Sakana AI, который изобрел open-source фреймворк TreeQuest. Он позволяет использовать сразу несколько разных больших языковых моделей для того, чтобы получить более точный результат. Еще немного поговорим о Grok4 Heavy.

Но начну я с голубей.

Читать

ML Q & AI. Глава 5. Уменьшение переобучения при помощи данных

Уровень сложностиСредний
Время на прочтение3 мин
Количество просмотров840

← Предыдущая глава | Следующая глава →

Предположим, что мы обучаем классификатор при помощи обучения с учителем и замечаем, что он страдает от переобучения. Какие существуют основные подходы для уменьшения переобучения путем модификации или дополнения данных?

Переобучение - достаточно широко распространенная проблема в машинном обучении, возникающая, когда модель слишком точно подстраивается под тренировочные данные. В результате она начинает учитывать шум и выбросы, а не взаимосвязи данных. Из-за этого модель хорошо работает на тренировочных данных, но плохо справляется с новыми или тестовыми. В идеале мы бы хотели полностью избежать переобучения, однако на практике это не всегда реально. Поэтому мы стараемся минимизировать его влияние на модель настолько, насколько это возможно.

Наиболее успешные методы, направленные на уменьшение переобучения, основаны на сборе большего количества высококачественных размеченных данных. Однако, если затраты на получение дополнительных размеченных данных оказываются неоправданными, мы можем рассмотреть варианты, такие как аугментация существующих данных или использование неразмеченных данных для предварительного обучения.

Читать далее

Вклад авторов