Все потоки
Поиск
Написать публикацию
Обновить
772.61

Машинное обучение *

Основа искусственного интеллекта

Сначала показывать
Период
Уровень сложности

«А можно быстрее?»: практические советы по ускорению обучения нейросетей

Уровень сложностиСредний
Время на прочтение12 мин
Количество просмотров5.6K

Мы продолжаем изучать, как ускоряют обучение нейросетей. В прошлой статье мы погрузились в теоретические аспекты этой проблемы. Сегодня перейдем к практике. 

Мы разберем несколько интересных исследований, которые демонстрируют эффективность различных подходов к ускорению нейросетей на разнообразных задачах и датасетах. Затем обсудим практические рекомендации по выбору и комбинированию методов оптимизации и расскажем, какие инструменты лучше использовать для профилирования и мониторинга процесса обучения. В довершение рассмотрим полезные библиотеки для быстрой и эффективной разработки.

Читать далее

Рекомендации историй ВКонтакте: от простой эвристики до ML-системы

Уровень сложностиСредний
Время на прочтение15 мин
Количество просмотров1.2K

Привет, Хабр! Я Степан Малькевич, руковожу командой рекомендации ленты ВКонтакте, AI VK. Сегодня расскажу, как мы за последний год прокачали алгоритмы рекомендаций для историй. Это был путь от MVP с простыми эвристиками до ML‑системы с моделированием авторов, поведенческими фичами и прицелом на онлайновые реакции.

Читать далее

Объяснимые нейросети (XAI): почему ИИ должен быть прозрачным?

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров1.5K

Всем привет. Сегодня хочу затронуть важную и интересную тему объясняемых нейросетей (XAI). 

«Почему ИИ принял такое решение?» — вопрос, который всё чаще задают не только разработчики, но и обычные пользователи. Нейросети уже помогают ставить диагнозы, одобрять кредиты, управлять автомобилями и даже вершить правосудие. Но как можно доверять системе, если никто — включая её создателей — не понимает, как она работает?

Современные модели машинного обучения, особенно глубокие нейросети, напоминают «чёрные ящики»: данные входят, ответ выходит, а что происходит внутри — загадка. И если для рекомендации фильма это не страшно, то в медицине, финансах или безопасности непрозрачность ИИ может стоить денег, репутации и даже жизней.

Именно поэтому на сцену выходит Explainable AI (XAI) — объяснимый искусственный интеллект.

Читать далее

Нейро-дайджест: ключевые события мира AI за 3 неделю августа 2025

Уровень сложностиСредний
Время на прочтение7 мин
Количество просмотров2.5K

Привет! Это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта и технологий.

Неделя выдалась интересной: Anthropic расширила контекст Claude Sonnet до миллиона токенов, Google выкатил Imagen 4, а Qwen добавили полноценный ИИ-фотошоп на базе своей модели. Энтузиасты делают нейро-читы для CS а Илон собрался судиться с Apple.

Всё самое важное — в одном месте.

Читать дайджест

Виртуальный рассказчик 2.0: эволюция нейросетевого рассказчика в Яндекс Книгах

Время на прочтение8 мин
Количество просмотров11K

Примерно год назад мы запустили виртуального рассказчика в Яндекс Книгах. Он хорошо решал задачу чтения книг вслух без предзаписанных аудиоверсий, но иногда звучал однообразно. Дело в том, что он был основан на небольшой нейросети — Tacotron. Проблема заключалась в том, что мы обучали модель для каждого спикера. И если спикер пользовался несколькими интонационными паттернами, то модель просто выбирала самый частый из них. 

Тогда мы начали активно экспериментировать c highres-моделями. Они могут учиться на большом количестве данных разного качества и поэтому способны воспроизводить более интонационно осмысленную речь. К тому же им не нужны вспомогательные модели, такие как PnG BERT или отдельные модели для расстановки пауз, — все эти интонационные нюансы они выучивают сами. У них есть хорошая способность к семплированию, в отличие от старых моделей, где один и тот же текст на разных генерациях произносился почти одинаково.

И вот мы покатили новые модели в прод. А я расскажу, как мы научились заводить highres-модели для синтеза книг и делать это в реалтайме, а также какую работу пришлось для этого провести.

Читать далее

Жестовый язык: похожее в непохожем и наоборот

Уровень сложностиСредний
Время на прочтение9 мин
Количество просмотров1.8K

Привет, Хабр! Наша команда RnD CV продолжает приближать момент, когда компьютер по видео сможет распознавать жестовый язык (ЖЯ) глухих так же качественно, как речь. 

Сегодня мы расскажем, как собрали один из самых больших в мире датасетов изолированного русского жестового языка Logos, чем различаются визуально одинаковые жесты, как мы с помощью нашего датасета обучили универсальную модель-энкодер и попутно заняли первую строчку в бенчмарке распознавания американского жестового языка. По итогам этой работы мы опубликовали препринт.

Читать далее

Тиндер для работодателей и соискателей: как мы разработали алгоритм мэтчинга на Авито

Время на прочтение10 мин
Количество просмотров15K

Всем привет! Я Владислав Урих, работаю продуктовым аналитиком в Авито, сейчас занимаюсь построением алгоритмов мэтчинга в новом транзакционном продукте — Авито Подработка. В статье рассказываю, как мы построили алгоритм мэтчинга — инструмент подбора оптимальной выдачи для каждого конкретного покупателя.

Вы узнаете, почему алгоритмы поиска в категориях Авито работают по-разному, как собрать и использовать больше данных о пользователях без анкет, легко проверить гипотезу в офлайн-тестах и получить значимые продуктовые улучшения. 

Текст будет полезен всем продуктовым аналитикам, ML-инженерам и продакт-менеджерам, которые работают с алгоритмическими продуктами.

Читать далее

Промпт-инжиниринг на основе здравого смысла: как понимать LLM и получать от них предсказуемый результат

Уровень сложностиСредний
Время на прочтение38 мин
Количество просмотров18K

80-90% моего кода на последних проектах написаны через LLM, при этом мне удается с первой генерации получать вплоть до 500-1000 строк комплексной бизнес логики, к тому же крайне высококачественной и полностью соответствующей стилю проекта. Использование ИИ позволяет мне получить около 3х к производительности, при этом повысить качество итогового кода и даже сделать разработку более увлекательной.

Мой подход основан на нескольких очень естественных принципах, которые позволяют мне понимать LLM и получать от них предсказуемый и качественный результат в самых разных сценариях. В этой статье я развернуто делюсь самым ценным, что понимаю о промпт-инжиниринге, надеюсь, она будет вам полезна.

Читать далее

Мышиная машина состояний: ученые обнаружили ключевой принцип обучения мозга — и он совпал с теорией Google

Уровень сложностиСредний
Время на прочтение12 мин
Количество просмотров9.2K

Задачу научить нейросети точно воспроизводить процессы, происходящие в живом мозге, пока решить не удалось. Одна из сложностей — понять, как именно мозг формирует «когнитивные карты» — внутренние представления о пространстве вокруг нас, которые помогают нам ориентироваться.

Исследователям из Janelia Research Campus (США) впервые удалось в реальном времени отследить, как создаются когнитивные карты. Используя комбинацию виртуальной реальности, генетически модифицированных мышей со «светящимися нейронами» и высокоточную микроскопию, они смогли увидеть, как гиппокамп — часть мозга, отвечающая за память и навигацию — формирует эти самые когнитивные карты.

Наблюдая за мышами, учившимися находить награду, исследователи увидели, как изначально хаотичная активность нейронов постепенно организуется, формируя четкие паттерны. Самым интересным оказалось, что процесс в точности соответствовал предсказаниям компьютерной модели CSCG (Clone-Structured Causal Graph), созданной специалистами Google DeepMind и Vicarious AI. О сути эксперимента и его результатах рассказываем в этом тексте.

Читать далее

Обучение и fine-tuning моделей простым языком: зачем, как, где

Уровень сложностиСредний
Время на прочтение18 мин
Количество просмотров14K

В нашей работе с большими языковыми моделями (LLMs), один из самых популярных вопросов касается их до-обучения. Каждый второй клиент спрашивает, нужно ли проводить дополнительное обучение модели.

Давайте рассмотрим нужно ли это, как это сделать.

Читать далее

Как мы обучили Mistral 7B русскому языку и адаптировали для объявлений Авито

Уровень сложностиСредний
Время на прочтение7 мин
Количество просмотров12K

Привет! Я Настя Рысьмятова, руковожу командой LLM в Авито. Эта статья — про то, какие задачи мы решаем с помощью языковых моделей и как адаптируем их под себя. Мой опыт будет интересен прежде всего тем, кто тоже занимается большими языковыми моделями в крупных продуктовых компаниях. А всем остальным любопытно будет узнать, как модели учатся и решают конкретные задачи Авито — например, помогают пользователям писать тексты объявлений.

Читать далее

Нейро-дайджест: ключевые события мира AI за 3 неделю сентября 2025

Уровень сложностиСредний
Время на прочтение7 мин
Количество просмотров1.7K

Привет! Это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта и технологий.

Неделя выдалась интересной: Alibaba показала Qwen 3 Next, Mistral получила $1,5 млрд инвестиций, а в Абу-Даби презентовали K2-Think. Replit выпустил Agent 3, ElevenLabs добавили Voice Remixing, а Google наконец сделали вертикалки в Veo 3. ИИ уже назначают министра в Албании и помогают выбирать премьера в Непале, а новые AirPods научились переводить в реальном времени.

Всё самое важное — в одном месте. Поехали!

Читать дайджест ⮕

Нейро-дайджест: ключевые события мира AI за 2 неделю сентября 2025

Уровень сложностиСредний
Время на прочтение6 мин
Количество просмотров1.7K

Привет! Это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта и технологий.
Меня зовут Вандер, и каждую неделю я обозреваю новости о нейросетях и ИИ.

Неделя выдалась интересной:: Qwen показали модель MAX на 1 трлн параметров, Anthropic собрали рекордные инвестиции, а в ChatGPT проекты стали бесплатными. На рынке появились новые агенты, звуковые модели и сервисы для создания приложений. Warner Bros. пошли в суд с Midjourney, а британские врачи тестируют стетоскоп с ИИ.

Всё самое важное — в одном месте. Поехали!

Читать дайджест ⮕

Ближайшие события

Нейро-дайджест: ключевые события мира AI за 4 неделю августа 2025

Уровень сложностиСредний
Время на прочтение7 мин
Количество просмотров2.4K

Привет! Это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта и технологий.

Неделя выдалась интересной: апдейт DeepSeek v3.1, xAI выложили веса Grok 2, а PewDiePie собрал собственный сервер для LLM. Alibaba презентовала кодинг-агента Qoder, Apple делает домашних ИИ-роботов, а нейросети теперь читают ваши мысли и предсказывают будущее.

Всё самое важное — в одном месте. Поехали!

Читать дайджест →

Новый релиз публичного детектора голоса Silero VAD v6

Уровень сложностиСредний
Время на прочтение2 мин
Количество просмотров3.5K

На Хабре уже было аж 3 статьи про развитие нашего публичного детектора голоса Silero VAD (последняя тут). А вот что стало лучше в этот раз:

Хочу узнать!

Как мы обучали модели для кода GigaCode

Уровень сложностиСредний
Время на прочтение6 мин
Количество просмотров4.4K

Привет, Хабр! Меня зовут Дмитрий Бабаев, я руководитель R&D GigaCode в Сбере. Сегодня расскажу о том, как мы создавали ИИ-помощника для программистов задолго до того, как это стало мейнстримом.

Многие компании думают о том, чтобы  выпустить собственного ИИ-помощника для разработчиков. Мы начали делать GigaCode около трех лет назад — ещё до появления Cursor и других популярных сегодня решений.

За это время мы создали целую экосистему решений для разработки – GigaDEV: IDE на основе IntelliJ, платформу Gitverse как аналог GitHub и сам GigaCode. 

Читать далее

Нейро-дайджест: ключевые события мира AI за 4-ю неделю июля 2025

Уровень сложностиСредний
Время на прочтение8 мин
Количество просмотров2.4K

Привет! Это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта и технологий.

Неделя выдалась интересной: Qwen показала мощные обновления линейки и модель для кодинга, OpenAI открыла ChatGPT Agent для всех подписчиков, а Figma научилась в один клик собирать полноценные сайты. Маск запускает суперкомпьютер Colossus 2, а подростки меняют ИИ на друзей.

Всё самое важное — в одном месте. Поехали!

Читать дайджест

Кому принадлежат права на произведения, созданные искусственным интеллектом?

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров4.4K

Нейросети уже пишут книги, рисуют картины и сочиняют музыку. Но кто получает авторские права на эти произведения? Может ли ИИ быть автором? Законодательство пока не успевает за технологиями, и это создаёт правовую неразбериху. Разбираемся, как защитить свои права и не нарушить чужие в эпоху нейросетей.

Читать далее

Как запустить нейросеть у себя на компьютере: 4 простых инструмента

Уровень сложностиПростой
Время на прочтение11 мин
Количество просмотров31K

Вы когда‑нибудь задумывались, как это — иметь мощь языковой модели прямо на вашем компьютере? Экспериментировать с LLM (большими языковыми моделями) локально — словно открыть тайную дверь в мир ИИ... Вам открыт широкий горизонт для исследований, творчества и практического применения.

Но как запустить нейросеть на компьютере, если вы не Google? Хорошая новость: в 2025 году это стало проще и доступнее, чем когда‑либо! Вам не нужен суперкомпьютер (хотя мощная видеокарта значительно ускорит процесс). Современные эффективные модели и специализированное ПО делают локальный запуск нейросети реальностью для многих пользователей.

Давайте разберёмся, что для этого нужно. Мы рассмотрим 7 наиболее оптимальных для локального запуска моделей — Llama, Qwen, DeepSeek, Phi, Gemma, Mistral, Granite, — а также 4 быстрые и удобные программы: Ollama, LM Studio, Jan и GPT4All.

Читать далее

Нейро-дайджест: ключевые события мира AI за 2-ю неделю июля 2025

Уровень сложностиСредний
Время на прочтение9 мин
Количество просмотров2.5K

Привет! Это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта и технологий.

Неделя выдалась интересной: Илон Маск представил Grok 4 с амбициями почти AGI, китайцы выпустили Kimi K2 — открытый MoE-гигант для кодинга, Google и Perplexity зарубились за рынок ИИ-браузеров, а в Нью-Йорке уже работает робот-татуировщик с ИИ, который бьёт тату без боли.

Всё самое важное — в одном месте. Поехали!

Читать дайджест

Вклад авторов