Все потоки
Поиск
Написать публикацию
Обновить
760.32

Машинное обучение *

Основа искусственного интеллекта

Сначала показывать
Период
Уровень сложности

Генерируем презентации с помощью GigaChat и Kandinsky

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров5.8K

Все мы время от времени сталкиваемся с необходимостью сделать презентацию, даже если наша работа, казалось бы, этого не предполагает. Часто это трудоёмкая задача, которая досадно надолго отвлекает от просмотра мемов действительно важных дел вроде написания кода и обучения моделей.

Мы решили проверить, насколько современные LLM и модели генерации изображений могут тут облегчить нам жизнь, учитывая, насколько мощно они продвинулись в последние годы. Для этого мы собрали MVP на базе GigaChat-Max и Kandinsky 3.1, принимающий на вход текстовый запрос и количество слайдов и генерирующий файл презентации в формате .pptx.

Читать далее

Grok-2 в деле: Способен ли ИИ от Илона Маска превзойти конкурентов?

Время на прочтение5 мин
Количество просмотров15K

В середине августа мы видели анонс бета-версий Grok-2 и Grok-2 mini от стартапа Илона Маска xAI. Что ж, на дворе осень, как пел Anacondaz "на улице дубак, на сердце тлен и мрак", так пусть же Grok 2 сегодня станет тем самым, кто укроет зацензуренным пледом наши тела. Предлагаю начинать.

Приятного прочтения!

Читать далее

Как мы запустили автоматическую модерацию видео в объявлениях Авито

Уровень сложностиСредний
Время на прочтение7 мин
Количество просмотров6.7K

Привет! Я Владимир Морозов, senior DS engineer в команде модерации Авито: в основном занимаюсь автомодерацией видео, но развиваю и другие проекты. В статье рассказываю, с какими трудностями мы столкнулись при модерации видео в условиях небольшого количества данных, и как их решили. Думаю, материал будет полезен всем, кто занимается похожими задачами в крупных продуктовых компаниях.

Читать далее

Как DS-инженеры совершенствуют автогенерацию описаний и пополняют индекс объявлений Авито

Время на прочтение6 мин
Количество просмотров7.3K

Привет! Я Сергей Кляхандлер, техлид в команде LLM Авито. В 2024 году мы разработали и выпустили ML-модель, которая автоматически генерирует описания для объявлений из категории «Одежда, обувь, аксессуары». В этом году автогенерацию усовершенствовали, а подход переиспользовали — подробнее о том, как мы это сделали, расскажу в статье. Материал будет полезен DS-инженерам, которые работают с мультимодальными LLM-моделями.

Читать далее

Как заменить GitHub Copilot на полностью офлайн‑Continue Plugin

Уровень сложностиСредний
Время на прочтение4 мин
Количество просмотров10K

В этом посте я покажу, как использовать Continue Plugin вместо GitHub Copilot, подключив к нему собственную локальную модель LLM без доступа к интернету. Такой подход обеспечивает максимальную конфиденциальность: ни IDE, ни LM Studio не имеют возможности передавать ваши файлы в облако.

Никакой сети – всё работает только в вашем компьютере.

Читать далее

Нейро-дайджест: ключевые события мира AI за 1 неделю августа 2025

Уровень сложностиСредний
Время на прочтение8 мин
Количество просмотров2.3K

Привет! Это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта и технологий.
Меня зовут Вандер, и каждую неделю я обозреваю новости о нейросетях и ИИ.

Неделя выдалась насыщенной и интересной: Google выкатили самую мощную версию Gemini, китайцы дропнули GLM‑4.5 и новый Wan, а в ChatGPT добавили полноценный режим репетитора. Новые релизы от Luma, Runway, xAI и Tencent. Microsoft Edge теперь ИИ-браузер, а YouTube внедряет ИИ для определения возраста.

Всё самое важное — в одном месте. Поехали!

Читать дайджест

Где живут LLM: разбираем инференс-кластер YADRO и гоняем в нем модели

Уровень сложностиСредний
Время на прочтение7 мин
Количество просмотров8.9K

Привет, Хабр! В этой статье я расскажу про наш LLM инференс-кластер YADRO: зачем он нужен, что у него под капотом и как в такой конфигурации показывают себя популярные модели. Кроме того, я немного порассуждаю об альтернативных реализациях кластера и поделюсь планами по развитию реализации нашей.

Читать далее

Нейро-дайджест: ключевые события мира AI за 1-ю неделю июля 2025

Уровень сложностиСредний
Время на прочтение10 мин
Количество просмотров2.3K

Привет! Это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта и технологий.

Неделя выдалась насыщенной: HuggingFace выпустили SmolLM 3 — лучшую 3B модель, Apple рассматривает Claude и GPT вместо Siri, а Suno всерьёз зашёл в продакшн и купил DAW. Нейро-GTA теперь можно пощупать, а Дания первой в ЕС вводит авторское право на внешность и голос для борьбы с дипфейками.

Всё самое важное — в одном месте. Поехали!

Читать дайджест

Тест-драйв Claude 4: Opus и Sonnet в бою за код и 3D

Уровень сложностиСредний
Время на прочтение12 мин
Количество просмотров15K

Май 2025-го выдался жарким на ИИ‑новости: Anthropic наконец запустила долгожданный Claude 4 — сразу в двух вариантах, Opus 4 и Sonnet 4. Это не просто апдейт, а гибридные рассуждающие модели, которые обещают совместить скорость ответов с глубоким анализом. Разработчики уже грезят ИИ, который программирует днями и ночами, а Anthropic называет это «новым рубежом для кодинга и автономных агентов». Скромничают? Возможно. Но факт: релиз важный.

Зачем это всё? Opus 4 способен неустанно кодить и решать многомодальные и агентные задачи, а Sonnet 4 призван поднять планку в массовых сценариях.

Читать далее

Как мы создали новую технологию маршрутизации для пешеходов и велосипедистов

Время на прочтение12 мин
Количество просмотров5.7K

Каждый день в Яндекс Картах строят миллионы пешеходных и велосипедных маршрутов. Несмотря на популярность, этот тип маршрутизации давно не менялся. В прошлом году мы решили его улучшить: проанализировали недостатки и узнали, что на самом деле нужно пользователям. Теперь мы готовы поделиться результатами крупного обновления наших маршрутов.

Меня зовут Антон Овчинкин, я руководитель разработки пешеходной и транспортной навигации в Картах. Я расскажу, как мы научили алгоритмы обходить промзоны, создали ML‑модель расчёта времени в пути с учётом светофоров и подъёмов, а ещё — как связана пешеходная маршрутизация и подсчёт калорий.

Читать далее

Как мы коня в пальто одевали. Neural Image Editing: Часть 1 — от инпейнтинга до DDIM Inversion

Уровень сложностиСредний
Время на прочтение15 мин
Количество просмотров2.8K

Что делать, если хочешь отредактировать картинку?

На фотошоп не хватает знаний, времени или сил. Inpaint-модели подводят. Конструкторы вроде ComfyUI требуют столько всего, что проще уж фотошопу научиться. Как было бы здорово показать картинку нейросети и написать: «Пожалуйста, смени юбку на джинсы. И сзади ещё одну клумбу добавь… И погода пусть солнечной будет!»

Увы, как бы ни ломали голову исследователи, задача произвольного нейросетевого редактирования изображений на сегодняшний день в целом не решена. Но пройден нелёгкий путь, и есть заметные достижения, о которых нельзя не рассказать.

Мастера фотошопа, оцените!

Эффективный пакетный инференс моделей. Опыт инженеров VK

Уровень сложностиСредний
Время на прочтение11 мин
Количество просмотров1.7K

Привет, Хабр!  На связи Артём Петров, я занимаюсь разработкой ПО в центре технологий VK. Хочу рассказать о важной задаче обработки больших объёмов данных с использованием нескольких экземпляров одной и той же модели машинного обучения. Этот процесс называется batch inference («пакетный инференс») и позволяет значительно повысить производительность системы, особенно когда речь идёт о таблицах большого размера.

Читать далее

Я работал в продуктовой команде 7 лет, а потом пришла нейросеть

Уровень сложностиПростой
Время на прочтение9 мин
Количество просмотров67K

Эту историю для моего блога рассказал Леонид Шашков и Илья Головко, CPO в крупном финтехе.

Еще пару лет назад моя работа продакт-менеджера выглядела как бесконечное жонглирование задачами: исследования пользователей, анализ конкурентов, документация, постановка задач, презентации... И так по кругу. Большую часть времени съедали рутинные задачи, которые требовали механической работы, но не давали простора для творчества. А теперь...

Я начал заниматься AI примерно три года назад, еще до того, как ChatGPT стал популярным. Начинал с простого, как и все, с написания текстов. Постепенно аппетиты росли — от текстов перешел к созданию презентаций с помощью Gamma и Tome, транскрибации аудио с 11labs, проверке писем и составлению обратной связи сотрудникам. Сегодня я расскажу, как ИИ помогает мне на каждом этапе разработки продукта, какие инструменты я применяю и где всё-таки без людей не обойтись.

Продакт-менеджер — это мозговой центр разработки продукта. Его работа включает анализ рынка, исследование потребностей, постановка задач команде, координация разработки и запуск на рынок. На каждом этапе нужно обрабатывать огромные объемы информации — отзывы пользователей, данные аналитики, тренды рынка, конкурентные решения. Нейросети помогают автоматизировать большую часть этой работы.

Читать далее

Ближайшие события

Погружение в мир диффузионных моделей — путеводитель для новичков

Уровень сложностиПростой
Время на прочтение26 мин
Количество просмотров4.9K

Диффузионные модели перевернули мир генеративного искусственного интеллекта, вытеснив GAN'ы и вариационные автоэнкодеры. Но как они работают? Чем отличаются друг от друга? И как научиться их использовать?

Эта статья — путеводитель для тех, кто хочет разобраться в диффузионных моделях с нуля. В ней вы найдете три подхода к изучению — теория, практика и продвинутая практика.

Читать далее

Как мы прикрутили RAG для интент-классификации, или Трудности перевода на LLM-ский

Уровень сложностиСредний
Время на прочтение13 мин
Количество просмотров5.9K

И не опять, а снова — про этот ваш RAG. Многие продуктовые команды сейчас пробуют приспособить его для своих задач — и мы, команда Speech&Text в компании Домклик, не избежали этой участи. Но не (только) потому, что это модно и молодёжно — попробовать RAG‑подход нас побудила необходимость решить определённые насущные проблемы. Что же это за проблемы, как мы встраивали RAG и что из этого получилось? Если интересно узнать, то милости просим в текст :-)

Читать далее

Первый шаг к кибернетическому тимлиду: автоматическое ревью кода на основе LLM

Время на прочтение10 мин
Количество просмотров9K

Привет, Хабр! Меня зовут Евгений Зорин, я ведущий разработчик в центре инноваций Future Crew. У моего проекта достаточно компактная команда. Нам постоянно нужно проверять критически важную функциональность, и часто это может сделать только сам разработчик. С появлением современных LLM, таких как ChatGPT, возникла идея об их внедрении для ревью кода. В качестве подопытного кролика был выбран Swift. В этом материале я расскажу, чего мы добились, какие инструменты использовали и как LLM справляется с поставленной задачей.

Читать далее

Микроархитектура простого нейросетевого ускорителя на SystemC

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров4.4K

Привет, Хабр! Меня зовут Михаил Степанов, я инженер-стажер группы функциональной верификации YADRO. Эта статья — логическое продолжение предыдущей, «Простая нейронная сеть на C++». Для лучшего понимания темы рекомендую сначала ознакомиться с ней.

В этих двух статьях я работал с синтетической задачей, решение которой нельзя применить в реальных системах. На всеобъемлющий анализ я не претендую, это просто академическое исследование. Оно поможет понять, с чего начать погружаться в тему ускорения нейросетей.

Читать далее

Машинное обучение на Spark

Уровень сложностиПростой
Время на прочтение14 мин
Количество просмотров2.9K

Существует множество подходов к машинному обучению. Со стороны может показаться, что генеративные модели на архитектуре под названием «трансформер» заняли передовые позиции и ближайшее обозримое будущее именно за ними. Но существуют и другие подходы к машинному обучению, которые тиражируются в медийном поле не так широко.

В этой статье вы познакомитесь с таким классом алгоритмов, как ансамблевые методы машинного обучения. А именно — градиентный бустинг на решающих деревьях. В основе они представляют из себя деревья решений, которые являются очень простой структурой, позволяющей получить ответ на основе входных данных. А еще мы разберемся, при чем тут Spark, и посмотрим на эти алгоритмы на практике.

Читать далее

Сканирование документов на планшетах Kvadra: как мы создавали и обучали алгоритм

Уровень сложностиСредний
Время на прочтение11 мин
Количество просмотров2K

Привет, Хабр! Меня зовут Владислав, я CV Engineer в компании YADRO. В этой статье я расскажу, как мы разрабатывали и обучали алгоритм детекции документов для нашего планшета Kvadra_T. Я подробно описал нюансы задачи и весь наш путь — от классического подхода до генерации недостающих датасетов и обучения на них нашей собственной нейросети. Постарался сделать историю интересной как для новичков в теме, так и для более опытных читателей. Режим детекции, кстати, уже доступен в kvadraOS.

Читать далее

Квантовый чип Willow от Google: много маркетинга и мало правды

Время на прочтение3 мин
Количество просмотров16K

СМИ взорвали новости о появлении самого быстрого компьютера в мире. Он за 5 минут смог решить задачу, которую классический ПК решал бы миллиард лет. Давайте посмотрим на чём эти и другие громкие заявления основаны и есть ли на данный момент хоть какие-то подтверждения прорыва в этом амбициозном очень-очень дорогом проекте.

Спойлер: нет.

Читать далее

Вклад авторов