Машинное обучение *

Основа искусственного интеллекта

СтатьиПостыНовостиАвторыКомпании

breakmirrors 1 окт 2024 в 09:37

«А можно быстрее?»: практические советы по ускорению обучения нейросетей

Средний

12 мин

5.6K

Блог компании Magnus TechПрограммирование * Машинное обучение * Искусственный интеллектTensorFlow *

Обзор

Мы продолжаем изучать, как ускоряют обучение нейросетей. В прошлой статье мы погрузились в теоретические аспекты этой проблемы. Сегодня перейдем к практике.

Мы разберем несколько интересных исследований, которые демонстрируют эффективность различных подходов к ускорению нейросетей на разнообразных задачах и датасетах. Затем обсудим практические рекомендации по выбору и комбинированию методов оптимизации и расскажем, какие инструменты лучше использовать для профилирования и мониторинга процесса обучения. В довершение рассмотрим полезные библиотеки для быстрой и эффективной разработки.

+30

smalkevich 16 сен в 14:14

Рекомендации историй ВКонтакте: от простой эвристики до ML-системы

Средний

15 мин

1.2K

Блог компании VKМашинное обучение * Искусственный интеллектСоциальные сети

Кейс

Привет, Хабр! Я Степан Малькевич, руковожу командой рекомендации ленты ВКонтакте, AI VK. Сегодня расскажу, как мы за последний год прокачали алгоритмы рекомендаций для историй. Это был путь от MVP с простыми эвристиками до ML‑системы с моделированием авторов, поведенческими фичами и прицелом на онлайновые реакции.

+29

asomegoodboy 30 авг в 08:05

Объяснимые нейросети (XAI): почему ИИ должен быть прозрачным?

Простой

6 мин

1.5K

Блог компании Timeweb CloudМашинное обучение * Искусственный интеллектПрограммирование *

Обзор

Всем привет. Сегодня хочу затронуть важную и интересную тему объясняемых нейросетей (XAI).

«Почему ИИ принял такое решение?» — вопрос, который всё чаще задают не только разработчики, но и обычные пользователи. Нейросети уже помогают ставить диагнозы, одобрять кредиты, управлять автомобилями и даже вершить правосудие. Но как можно доверять системе, если никто — включая её создателей — не понимает, как она работает?

Современные модели машинного обучения, особенно глубокие нейросети, напоминают «чёрные ящики»: данные входят, ответ выходит, а что происходит внутри — загадка. И если для рекомендации фильма это не страшно, то в медицине, финансах или безопасности непрозрачность ИИ может стоить денег, репутации и даже жизней.

Именно поэтому на сцену выходит Explainable AI (XAI) — объяснимый искусственный интеллект.

+29

Wonderlove 21 авг в 14:05

Нейро-дайджест: ключевые события мира AI за 3 неделю августа 2025

Средний

7 мин

2.5K

Блог компании Timeweb CloudИскусственный интеллектМашинное обучение * IT-компанииБудущее здесь

Дайджест

Привет! Это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта и технологий.

Неделя выдалась интересной: Anthropic расширила контекст Claude Sonnet до миллиона токенов, Google выкатил Imagen 4, а Qwen добавили полноценный ИИ-фотошоп на базе своей модели. Энтузиасты делают нейро-читы для CS а Илон собрался судиться с Apple.

Всё самое важное — в одном месте.

Читать дайджест

+29

aaplakhin 15 авг в 07:30

Виртуальный рассказчик 2.0: эволюция нейросетевого рассказчика в Яндекс Книгах

8 мин

11K

Блог компании ЯндексМашинное обучение * Искусственный интеллектЗвукNatural Language Processing *

Примерно год назад мы запустили виртуального рассказчика в Яндекс Книгах. Он хорошо решал задачу чтения книг вслух без предзаписанных аудиоверсий, но иногда звучал однообразно. Дело в том, что он был основан на небольшой нейросети — Tacotron. Проблема заключалась в том, что мы обучали модель для каждого спикера. И если спикер пользовался несколькими интонационными паттернами, то модель просто выбирала самый частый из них.

Тогда мы начали активно экспериментировать c highres-моделями. Они могут учиться на большом количестве данных разного качества и поэтому способны воспроизводить более интонационно осмысленную речь. К тому же им не нужны вспомогательные модели, такие как PnG BERT или отдельные модели для расстановки пауз, — все эти интонационные нюансы они выучивают сами. У них есть хорошая способность к семплированию, в отличие от старых моделей, где один и тот же текст на разных генерациях произносился почти одинаково.

И вот мы покатили новые модели в прод. А я расскажу, как мы научились заводить highres-модели для синтеза книг и делать это в реалтайме, а также какую работу пришлось для этого провести.

+29

iovodov 19 июн в 11:06

Жестовый язык: похожее в непохожем и наоборот

Средний

9 мин

1.8K

Блог компании СберМашинное обучение * Обработка изображений * Искусственный интеллект

Привет, Хабр! Наша команда RnD CV продолжает приближать момент, когда компьютер по видео сможет распознавать жестовый язык (ЖЯ) глухих так же качественно, как речь.

Сегодня мы расскажем, как собрали один из самых больших в мире датасетов изолированного русского жестового языка Logos, чем различаются визуально одинаковые жесты, как мы с помощью нашего датасета обучили универсальную модель-энкодер и попутно заняли первую строчку в бенчмарке распознавания американского жестового языка. По итогам этой работы мы опубликовали препринт.

+29

vladis_rich 31 мая в 17:20

Тиндер для работодателей и соискателей: как мы разработали алгоритм мэтчинга на Авито

10 мин

15K

Блог компании AvitoTechМашинное обучение * Поисковые технологии * Поисковая оптимизация * Управление продуктом *

Аналитика

Всем привет! Я Владислав Урих, работаю продуктовым аналитиком в Авито, сейчас занимаюсь построением алгоритмов мэтчинга в новом транзакционном продукте — Авито Подработка. В статье рассказываю, как мы построили алгоритм мэтчинга — инструмент подбора оптимальной выдачи для каждого конкретного покупателя.

Вы узнаете, почему алгоритмы поиска в категориях Авито работают по-разному, как собрать и использовать больше данных о пользователях без анкет, легко проверить гипотезу в офлайн-тестах и получить значимые продуктовые улучшения.

Текст будет полезен всем продуктовым аналитикам, ML-инженерам и продакт-менеджерам, которые работают с алгоритмическими продуктами.

+29

Iqber 10 мая в 13:01

Промпт-инжиниринг на основе здравого смысла: как понимать LLM и получать от них предсказуемый результат

Средний

38 мин

18K

Машинное обучение * Искусственный интеллект

FAQ

80-90% моего кода на последних проектах написаны через LLM, при этом мне удается с первой генерации получать вплоть до 500-1000 строк комплексной бизнес логики, к тому же крайне высококачественной и полностью соответствующей стилю проекта. Использование ИИ позволяет мне получить около 3х к производительности, при этом повысить качество итогового кода и даже сделать разработку более увлекательной.

Мой подход основан на нескольких очень естественных принципах, которые позволяют мне понимать LLM и получать от них предсказуемый и качественный результат в самых разных сценариях. В этой статье я развернуто делюсь самым ценным, что понимаю о промпт-инжиниринге, надеюсь, она будет вам полезна.

+29

maxim_tsar 6 мар в 08:21

Мышиная машина состояний: ученые обнаружили ключевой принцип обучения мозга — и он совпал с теорией Google

Средний

12 мин

9.2K

Блог компании ГазпромбанкЧитальный залМашинное обучение * БиологияНаучно-популярное

Задачу научить нейросети точно воспроизводить процессы, происходящие в живом мозге, пока решить не удалось. Одна из сложностей — понять, как именно мозг формирует «когнитивные карты» — внутренние представления о пространстве вокруг нас, которые помогают нам ориентироваться.

Исследователям из Janelia Research Campus (США) впервые удалось в реальном времени отследить, как создаются когнитивные карты. Используя комбинацию виртуальной реальности, генетически модифицированных мышей со «светящимися нейронами» и высокоточную микроскопию, они смогли увидеть, как гиппокамп — часть мозга, отвечающая за память и навигацию — формирует эти самые когнитивные карты.

Наблюдая за мышами, учившимися находить награду, исследователи увидели, как изначально хаотичная активность нейронов постепенно организуется, формируя четкие паттерны. Самым интересным оказалось, что процесс в точности соответствовал предсказаниям компьютерной модели CSCG (Clone-Structured Causal Graph), созданной специалистами Google DeepMind и Vicarious AI. О сути эксперимента и его результатах рассказываем в этом тексте.

+29

Squirrelfm 12 дек 2024 в 15:01

Обучение и fine-tuning моделей простым языком: зачем, как, где

Средний

18 мин

14K

Блог компании RaftМашинное обучение * Искусственный интеллект

Туториал

В нашей работе с большими языковыми моделями (LLMs), один из самых популярных вопросов касается их до-обучения. Каждый второй клиент спрашивает, нужно ли проводить дополнительное обучение модели.

Давайте рассмотрим нужно ли это, как это сделать.

+29

Anastasiya_Rysmyatova 24 окт 2024 в 06:00

Как мы обучили Mistral 7B русскому языку и адаптировали для объявлений Авито

Средний

7 мин

12K

Блог компании AvitoTechIT-компанииМашинное обучение * Искусственный интеллект

Обзор

Привет! Я Настя Рысьмятова, руковожу командой LLM в Авито. Эта статья — про то, какие задачи мы решаем с помощью языковых моделей и как адаптируем их под себя. Мой опыт будет интересен прежде всего тем, кто тоже занимается большими языковыми моделями в крупных продуктовых компаниях. А всем остальным любопытно будет узнать, как модели учатся и решают конкретные задачи Авито — например, помогают пользователям писать тексты объявлений.

+29

Wonderlove 18 сен в 09:05

Нейро-дайджест: ключевые события мира AI за 3 неделю сентября 2025

Средний

7 мин

1.7K

Блог компании Timeweb CloudБудущее здесьИскусственный интеллектIT-компанииМашинное обучение *

Дайджест

Неделя выдалась интересной: Alibaba показала Qwen 3 Next, Mistral получила $1,5 млрд инвестиций, а в Абу-Даби презентовали K2-Think. Replit выпустил Agent 3, ElevenLabs добавили Voice Remixing, а Google наконец сделали вертикалки в Veo 3. ИИ уже назначают министра в Албании и помогают выбирать премьера в Непале, а новые AirPods научились переводить в реальном времени.

Всё самое важное — в одном месте. Поехали!

Читать дайджест ⮕

+28

Wonderlove 11 сен в 08:05

Нейро-дайджест: ключевые события мира AI за 2 неделю сентября 2025

Средний

6 мин

1.7K

Блог компании Timeweb CloudИскусственный интеллектМашинное обучение * IT-компанииБудущее здесь

Дайджест

Привет! Это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта и технологий.
Меня зовут Вандер, и каждую неделю я обозреваю новости о нейросетях и ИИ.

Неделя выдалась интересной:: Qwen показали модель MAX на 1 трлн параметров, Anthropic собрали рекордные инвестиции, а в ChatGPT проекты стали бесплатными. На рынке появились новые агенты, звуковые модели и сервисы для создания приложений. Warner Bros. пошли в суд с Midjourney, а британские врачи тестируют стетоскоп с ИИ.

Всё самое важное — в одном месте. Поехали!

Читать дайджест ⮕

+28

Wonderlove 28 авг в 14:05

Нейро-дайджест: ключевые события мира AI за 4 неделю августа 2025

Средний

7 мин

2.4K

Блог компании Timeweb CloudИскусственный интеллектМашинное обучение * Будущее здесьIT-компании

Дайджест

Неделя выдалась интересной: апдейт DeepSeek v3.1, xAI выложили веса Grok 2, а PewDiePie собрал собственный сервер для LLM. Alibaba презентовала кодинг-агента Qoder, Apple делает домашних ИИ-роботов, а нейросети теперь читают ваши мысли и предсказывают будущее.

Всё самое важное — в одном месте. Поехали!

Читать дайджест →

+28

snakers4 26 авг в 07:50

Новый релиз публичного детектора голоса Silero VAD v6

Средний

2 мин

3.5K

Машинное обучение * Искусственный интеллектГолосовые интерфейсы * Open source * Python *

Туториал

На Хабре уже было аж 3 статьи про развитие нашего публичного детектора голоса Silero VAD (последняя тут). А вот что стало лучше в этот раз:

Хочу узнать!

+28

ratatosk 8 авг в 15:05

Как мы обучали модели для кода GigaCode

Средний

6 мин

4.4K

Блог компании СберМашинное обучение * Искусственный интеллект

Кейс

Привет, Хабр! Меня зовут Дмитрий Бабаев, я руководитель R&D GigaCode в Сбере. Сегодня расскажу о том, как мы создавали ИИ-помощника для программистов задолго до того, как это стало мейнстримом.

Многие компании думают о том, чтобы выпустить собственного ИИ-помощника для разработчиков. Мы начали делать GigaCode около трех лет назад — ещё до появления Cursor и других популярных сегодня решений.

За это время мы создали целую экосистему решений для разработки – GigaDEV: IDE на основе IntelliJ, платформу Gitverse как аналог GitHub и сам GigaCode.

+28

Wonderlove 31 июл в 14:05

Нейро-дайджест: ключевые события мира AI за 4-ю неделю июля 2025

Средний

8 мин

2.4K

Блог компании Timeweb CloudIT-компанииБудущее здесьМашинное обучение * Искусственный интеллект

Дайджест

Неделя выдалась интересной: Qwen показала мощные обновления линейки и модель для кодинга, OpenAI открыла ChatGPT Agent для всех подписчиков, а Figma научилась в один клик собирать полноценные сайты. Маск запускает суперкомпьютер Colossus 2, а подростки меняют ИИ на друзей.

Всё самое важное — в одном месте. Поехали!

Читать дайджест

+28

Hanamime 29 июл в 15:45

Кому принадлежат права на произведения, созданные искусственным интеллектом?

Простой

6 мин

4.4K

Блог компании СберЗаконодательство в ITКопирайтИскусственный интеллектМашинное обучение *

Обзор

Нейросети уже пишут книги, рисуют картины и сочиняют музыку. Но кто получает авторские права на эти произведения? Может ли ИИ быть автором? Законодательство пока не успевает за технологиями, и это создаёт правовую неразбериху. Разбираемся, как защитить свои права и не нарушить чужие в эпоху нейросетей.

+28

dmitrifriend 28 июл в 12:55

Как запустить нейросеть у себя на компьютере: 4 простых инструмента

Простой

11 мин

31K

Блог компании BotHubИскусственный интеллектКомпьютерное железоМашинное обучение *

Обзор

Вы когда‑нибудь задумывались, как это — иметь мощь языковой модели прямо на вашем компьютере? Экспериментировать с LLM (большими языковыми моделями) локально — словно открыть тайную дверь в мир ИИ... Вам открыт широкий горизонт для исследований, творчества и практического применения.

Но как запустить нейросеть на компьютере, если вы не Google? Хорошая новость: в 2025 году это стало проще и доступнее, чем когда‑либо! Вам не нужен суперкомпьютер (хотя мощная видеокарта значительно ускорит процесс). Современные эффективные модели и специализированное ПО делают локальный запуск нейросети реальностью для многих пользователей.

Давайте разберёмся, что для этого нужно. Мы рассмотрим 7 наиболее оптимальных для локального запуска моделей — Llama✶, Qwen, DeepSeek, Phi, Gemma, Mistral, Granite, — а также 4 быстрые и удобные программы: Ollama, LM Studio, Jan и GPT4All.

+28

Wonderlove 17 июл в 14:05

Нейро-дайджест: ключевые события мира AI за 2-ю неделю июля 2025

Средний

9 мин

2.5K

Блог компании Timeweb CloudИскусственный интеллектМашинное обучение * Будущее здесьIT-компании

Дайджест

Неделя выдалась интересной: Илон Маск представил Grok 4 с амбициями почти AGI, китайцы выпустили Kimi K2 — открытый MoE-гигант для кодинга, Google и Perplexity зарубились за рынок ИИ-браузеров, а в Нью-Йорке уже работает робот-татуировщик с ИИ, который бьёт тату без боли.

Всё самое важное — в одном месте. Поехали!

Читать дайджест

+28

1 2 ...

12 13

15 16 ...

91 92

Машинное обучение *

«А можно быстрее?»: практические советы по ускорению обучения нейросетей

Рекомендации историй ВКонтакте: от простой эвристики до ML-системы

Объяснимые нейросети (XAI): почему ИИ должен быть прозрачным?

Нейро-дайджест: ключевые события мира AI за 3 неделю августа 2025

Виртуальный рассказчик 2.0: эволюция нейросетевого рассказчика в Яндекс Книгах

Жестовый язык: похожее в непохожем и наоборот

Тиндер для работодателей и соискателей: как мы разработали алгоритм мэтчинга на Авито

Промпт-инжиниринг на основе здравого смысла: как понимать LLM и получать от них предсказуемый результат

Мышиная машина состояний: ученые обнаружили ключевой принцип обучения мозга — и он совпал с теорией Google

Обучение и fine-tuning моделей простым языком: зачем, как, где

Как мы обучили Mistral 7B русскому языку и адаптировали для объявлений Авито

Нейро-дайджест: ключевые события мира AI за 3 неделю сентября 2025

Нейро-дайджест: ключевые события мира AI за 2 неделю сентября 2025

Ближайшие события

Нейро-дайджест: ключевые события мира AI за 4 неделю августа 2025

Новый релиз публичного детектора голоса Silero VAD v6

Как мы обучали модели для кода GigaCode

Нейро-дайджест: ключевые события мира AI за 4-ю неделю июля 2025

Кому принадлежат права на произведения, созданные искусственным интеллектом?

Как запустить нейросеть у себя на компьютере: 4 простых инструмента

Нейро-дайджест: ключевые события мира AI за 2-ю неделю июля 2025

Вклад авторов