Все потоки
Поиск
Написать публикацию
Обновить
856.2

Машинное обучение *

Основа искусственного интеллекта

Сначала показывать
Порог рейтинга
Уровень сложности

Как пользоваться Veo 3: примеры промптов от простого к сложному

Уровень сложностиПростой
Время на прочтение14 мин
Количество просмотров3.9K

Думаете, нейросеть для генерации видео Veo 3 — это непроходимый квест? Вовсе нет! Это как давать задание самому внимательному режиссёру. Всё просто: всего пара хитрых приёмов в запросе — и вот уже готова крутая видеосториз с идеальным светом, звуком и одним и тем же героем. Нет, это не магия, это умные промпты. Проверим?

Мы раскроем секреты, чтобы ваши ролики выглядели как снятые голливудской камерой. Готовьтесь к идеальным роликам без лишних слов.

Читать далее

Смерть fine-tuning? Почему RAG и промпт-инженерия вытесняют дообучение моделей

Уровень сложностиПростой
Время на прочтение10 мин
Количество просмотров8.4K

Привет, Хабр! Я — Владимир Килязов, эксперт по машинному обучению в Cloud.ru. Последние несколько лет я активно помогаю бизнесу и технарям работать с LLM в своих задачах без космических бюджетов.

Помните времена, когда для обучения языковой модели новым трюкам, ее обязательно «доводили» на специальных датасетах? Теперь есть и другие варианты. Вместо классического дообучения можно использовать RAG и промт-инженерию, и это будет быстрее и дешевле. Получается, fine-tuning больше не нужен? Про это и порассуждаем тут в статье.

Читать дальше

Многозадачные и интеллектуальные. Как мы обучали колонки Sber понимать сразу несколько команд умного дома

Время на прочтение7 мин
Количество просмотров1.6K

Салют, Хабр!

Я Иван, в SberDevices я руковожу направлением голосового управления умным домом. Сегодня выпустили большое обновление — теперь взаимодействие пользователя с Умным домом Sber через умные колонки стало проще и удобнее. Колонке можно одной репликой дать сразу несколько команд; можно управлять освещением и климатом нативными командами — сказать: «Салют, мне темно», чтобы включился свет. Ещё появилась возможность создавать сценарии с помощью GigaChat: если сказать умной колонке: «Салют, я проснулся», она предложит варианты действий с устройствами умного дома: включить свет? Открыть шторы? Когда вы подтвердили выбор, колонка сама создаст в приложении сценарий.  

Благодаря обновлению пользователю стало проще и органичнее управлять умным домом. В этой статье расскажу, как мы реализовали многозадачность в умных колонках.

Читать далее

Литературный обзор на статью: StyleGAN-NADA: CLIP-Guided Domain Adaptation of Image Generators

Уровень сложностиСредний
Время на прочтение9 мин
Количество просмотров401

StyleGAN-NADA (No Annotation Domain Adaptation) - метод, разработанный специалистами из Tel Aviv University и NVIDIA Research, позволяющий адаптировать генеративную модель (StyleGAN2) к новому домену без единого изображения, использующий только семантическую силу больших моделей, предварительно обученных контрастивным методом на тексте и изображениях (СLIP). На рисунке 1 представлены возможности метода StyleGAN-NADA.

Читать далее

ИИ-шлак убивает Интернет?

Время на прочтение12 мин
Количество просмотров2.3K

Инструменты на искусственном интеллекте меняют то, как люди находят информацию в Интернете, и это происходит быстрее, чем издатели успевают адаптироваться. Когда пользователи задают вопросы чат-ботам вместо поисковых систем, они получают ответы, а не ссылки для перехода. Это перестраивает экономику интернета, а особенно — экономику новостных изданий, которые тратят деньги на сбор информации, но уже не могут монетизировать эту работу.

За последние годы миллионы пользователей переключились с поисковиков на ИИ-чат-инструменты для поиска рекомендаций и получения ответов в реальном времени. Такие сервисы, как ChatGPT, Claude и Perplexity, теперь напрямую отвечают на вопросы, которые раньше отправляли читателей к первичным онлайн-источникам, которым они привыкли доверять. По мере того как пользователи отходят от проверенных новостных источников, они все больше доверяют системам ИИ, натренированным имитировать авторитет, — инструментам, которые выкачивают ответы из сети, но не несут ответственности.

Читать далее

Как мы внедряли семантический поиск по сообществам ВКонтакте: про раков, астрологию и затянувшийся таймлайн проекта

Уровень сложностиСредний
Время на прочтение9 мин
Количество просмотров1.2K

Представьте ситуацию: вам захотелось заказать раков. Что будете делать? Есть несколько вариантов, один из них — поискать подходящее заведение с доставкой в социальных сетях. Там можно найти локальную компанию с хорошими отзывами и приемлемыми ценами. Вы заходите ВКонтакте, открываете поиск по сообществам, вбиваете запрос «заказ раков» и получаете... подборку сообществ по астрологии. Совпадение по тексту есть, паблики популярные, можно сказать, что алгоритмы справились. Вы узнали о влиянии планет на вашу судьбу, но остались без раков.

Казалось бы, запрос звучал очевидно, но для классического текстового поиска это задача со звёздочкой. На помощь приходит семантический поиск — технология, которая обещает понять не только буквы в запросе, но и смыслы, стоящие за ними.

Меня зовут Арсений Расов, я тимлид ML-инженеров в команде поиска AI VK. В этой статье расскажу, как мы с командой внедряли семантический поиск по сообществам ВКонтакте и почему задача, рассчитанная на два месяца, заняла полгода. Рассмотрим современные NLP-технологии в продакшене и поговорим про непредсказуемость проверенных алгоритмов за пределами Jupyter Notebook.

Читать далее

Почему ChatGPT может сделать нас глупее и как этого избежать

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров1.2K

Некоторые исследования показывают, что активное использование ИИ снижает мозговую активность на 47%. Разбираемся, насколько это критично и как защитить свои когнитивные способности.

Читать далее

Аккуратные дипфейки: как невидимые подмены лиц рушат доверие к видео

Время на прочтение4 мин
Количество просмотров1.2K

Многие привыкли думать о дипфейках как о полностью поддельных видео: будто кто-то взял, полностью заменил лицо или сгенерировал всё с нуля. Но на деле всё становится куда тоньше — и опаснее. Представьте, если в знакомом ролике тихо изменили всего один жест, переставили предмет на фоне или ловко стерли пару кадров. Такие незаметные правки почти не отличить ни невооружённым глазом, ни специальными программами. И вот это — уже сегодняшняя реальность. Исследователи придумали для таких скрытых подделок отдельный термин, собрали крупный набор примеров и даже показали, почему современные детекторы и мы сами так часто оказываемся в дураках. Как работают эти новые "невидимые" дипфейки, чем они опасны и что вообще с этим делать — в новом разборе.

Читать далее

Всё что нужно знать про torch.sparse

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров500

Разработчики PyTorch предоставили модуль torch.sparse для работы с разреженными тензорами, где большинство элементов – нули. Зачем это нужно? Представьте матрицу смежности графа, сильно обрезанную сеть или облако точек – хранить такие данные плотным массивом без надобности расточительно. Разрежённая структура сохраняет только ненулевые элементы и их индексы, что сильно экономит память и ускоряет вычисления. Например, матрица размером 10,000 на 10,000 с 100 000 ненулевых float-значений в разрежённом COO-формате займёт не 400 МБ, а около 2 МБ.

Несмотря на перспективы, API разрежённых тензоров в PyTorch пока в бете и может менять крошечные детали. Будьте к этому готовы: часть операций поддерживается, часть – нет, и некоторые автоград-ячейки пока работают только для COO, а для CSR, например, градиент не считается. Но обо всём по порядку.

Читать далее

Что слепой знает о мире? Большие языковые модели и география

Уровень сложностиПростой
Время на прочтение17 мин
Количество просмотров4.7K

Изображение выше принято рекомендовать как древнюю карту мира римского географа Помпония Мелы. Это не совсем так. Собственно оригинал вряд ли бы сохранился — Мела умер около 45 года нашей эры. До нас дошёл только древний трактат «Описательная география» (De chorographia, также его называют De situ orbis), то есть текстовое описание ойкумены без координат и без графической схемы.

Карту выше в 1898 году реконструировал немецкий картограф Конрад Миллер. Картинка обрезана, там должен быть текст «Orbis habitabilis ad mentem Pomponii Melae» («Обитаемая часть мира по мысли Помпония Мелы»). Лист с картой вышел в шестом выпуске серии Миллера «Mappae mundi. Древнейшие карты мира» (Mappaemundi. Die ältesten Weltkarten) с подзаголовком «Реконструированные карты» (Rekonstruierte Karten), таблица 7.

Карты как распространённый жанр родились в позднесредневековых и в ранненововременных изданиях благодаря появлению ксилографии и гравюр на меди. Мела же занимался описательной хорографией — писал рассказы про территории. Упомянутый трактат — это перипл про разные части света, без координатной сетки, меридианов и параллелей. Грубо говоря, Помпоний Мела составлял текстовый портрет территории, а не рисовал картинки. Как же из этого получился вот этот рисунок?

Читать далее

Скрытая угроза: как LLM заражают друг друга предубеждениями через «безобидные» данные

Время на прочтение6 мин
Количество просмотров1.1K

tl;dr. Мы изучаем сублиминальное обучение — неожиданное явление, при котором языковые модели перенимают свойства из данных, сгенерированных другой моделью, даже если эти данные семантически никак не связаны с передаваемыми свойствами. Например, «студент» начинает предпочитать сов, если его обучить на последовательностях чисел, сгенерированных «учителем», который предпочитает сов. Тот же феномен способен передавать misalignment через данные, которые выглядят абсолютно безобидными. Этот эффект проявляется только в том случае, если учитель и студент основаны на одной и той же базовой модели.

Исследование проведено в рамках программы Anthropic Fellows. Эта статья также опубликована в блоге Anthropic Alignment Science.

Читать далее

Как аналитики Авито с помощью ML помогают людям выбирать хорошие авто с пробегом

Уровень сложностиСредний
Время на прочтение13 мин
Количество просмотров15K

Привет! Меня зовут Илья Комутков, я старший аналитик в Автотеке Авито — сервисе по проверке истории автомобилей с пробегом. В статье расскажу, как мы улучшаем проверку машин и создаём алгоритм рекомендаций по дальнейшим действиям для покупателей. Текст будет интересен начинающим или middle-аналитикам, которые уже умеют работать с SQL, python, ML, но ещё не решали многоэтапные задачи, влияющие на бизнес, и ищут способы применить свои навыки в работе.

Читать далее

Промпты для Veo 3: как создать идеальное видео?

Уровень сложностиПростой
Время на прочтение16 мин
Количество просмотров3.9K

Вы тоже видели эти впечатляющие демо‑ролики, созданные Google Veo 3, и хотите повторить?

Генерация видео по текстовому описанию перестала быть фантастикой. Нейросеть Veo 3 уверенно доказывает это, превращая ваши идеи в кинематографичные кадры. Секрет успеха кроется в правильно составленном промпте.

Революционная модель, появившаяся в мае 2025 года, мыслит визуальными категориями, и наша задача — говорить с ней на одном языке. Это подробное руководство расскажет, как составлять эффективные промпты для Veo 3, структурировать их, избегать распространенных ошибок и точно доносить до ИИ свои творческие замыслы.

Читать далее

Ближайшие события

AI Native Science: наука в эпоху ИИ-трансформации

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров976

Искусственный интеллект меняет ландшафт научных открытий и значительно ускоряет исследования. Современные системы могут изучать литературу, строить гипотезы и генерировать экспертные статьи — для этого достаточно ввести пару промтов.   

Привет, Хабр! Меня зовут Алексей Шпильман, я лидер центра «AI для науки» в Сбербанке. В этой статье я расскажу, как AI повлиял на научную среду, какие ИИ-решения сегодня актуальны и какое будущее ждет AI Native Science. 

Читать далее

SEO в эпоху искусственного интеллекта: как изменились правила игры

Уровень сложностиСредний
Время на прочтение9 мин
Количество просмотров3.1K

Сейчас технологии развиваются стремительными темпами – и искусственный интеллект занимает всё более важное место в каждой сфере, включая поисковую оптимизацию. Меня зовут Максим Улендеев, я SEO-специалист Beget и в этой статье расскажу, что изменилось в цифровом поиске в эпоху развития искусственного интеллекта.

Итак, классическое SEO — это набор стратегий и тактик, которые помогают сайту занять высокие позиции в органической выдаче поисковых систем, таких как Google и Яндекс. Основная цель остается прежней — привлечение целевого трафика через релевантные запросы. В традиционном SEO ключевыми элементами были работа с семантическим ядром, техническая оптимизация сайта, улучшение поведенческих факторов и построение ссылочного профиля.

Но поисковая среда стремительно меняется. С развитием искусственного интеллекта привычная модель поиска претерпевает трансформацию: пользователи всё чаще получают готовые ответы, сформированные нейросетями. В Яндексе эту функцию выполняет «Яндекс Нейро» (сейчас интегрированная в Алису), в Google — «AI Overviews». Такие решения всё чаще подменяют классическую выдачу ссылок краткими обобщениями с указанием источников.

Читать далее

5 задач, которые UX-исследователи Авито решают с помощью нейросетей

Уровень сложностиСредний
Время на прочтение7 мин
Количество просмотров5.9K

Привет! Меня зовут Маша Московкина, я UX-исследователь в Авито Работе. В UX часть задач — это рутина, а ИИ отлично справляется с однообразными задачами. Поэтому иногда с его помощью мы упрощаем работу себе и коллегам из других функций. В статье поделюсь идеями, как вы тоже сможете использовать ИИ в работе, а также покажу 5 примеров наших рабочих промптов. Статья будет интересна исследователям и дизайнерам, которые хотят использовать в работе искусственный интеллект.

Читать далее

Athenix — мониторинг котировок с глубоким анализом объёмов и прогнозами от ИИ

Уровень сложностиСредний
Время на прочтение13 мин
Количество просмотров2.6K

Проект Athenix — это уникальная система мониторинга котировок с глубоким анализом объёмов торгов и прогнозами на основе искусственного интеллекта. Если вы интересуетесь финансовыми рынками, трейдингом и современными технологиями, эта статья для вас.

Созданная на Python, платформа Athenix сочетает мощь вычислений, анализ временных рядов и нейросетевые модели для прогнозирования динамики цен на бирже MOEX и потенциалом подключения к другим биржам. В статье вы узнаете, как автор с опытом работы на биржах и в программировании реализовал систему, которая собирает данные, анализирует их с помощью инновационных алгоритмов и визуализирует результаты в удобном для анализа виде.

Проект предлагает практичный подход к сложностям анализа рынка — концентрируется на главном, снимая с трейдера необходимость обрабатывать сотни показателей вручную. Будут подробно рассмотрены методы обработки объёмных данных, шумоподавление с вейвлет-преобразованиями, бинарное прогнозирование и использование LSTM-нейросетей.

Эта статья будет полезна тем, кто хочет понять, как современные технологии и алгоритмы могут помочь в эффективной среднесрочной и долгосрочной торговле. Погрузитесь в мир финансового анализа будущего с Athenix!

Читать далее

Вкусы и предпочтения больших языковых моделей

Уровень сложностиПростой
Время на прочтение29 мин
Количество просмотров2.1K

У больших языковых моделей есть системы ценностей. БЯМ по-разному отзываются о чужих текстах или даже человеческой жизни, а их оценочные суждения и качество ответов отличаются в зависимости от упоминаемой расы, пола и национальности человека. Не вызывает никаких сомнений, что подобную предвзятость систем на искусственном интеллекте нужно искоренять.

Однако также у моделей есть предпочтения. Разные БЯМ называют любимыми разные песни, кино и книги. ИИ одного провайдера предпочитает одну разновидность мороженого, у конкурентов языковая модель любит десерты другого вкуса. Ответы на подобные вопросы глубоко субъективны, одного морально правильного нет.

Можно даже сказать, что вкусы — это частный случай систем ценностей. Разница в том, что явных угроз подобные артефакты выравнивания не несут. Какая разница, предпочитает ли БЯМ джаз или рок?

Читать далее

Протокол Вихрь: Архитектура целостности ИИ. Как защитить ИИ (и себя)

Уровень сложностиСложный
Время на прочтение15 мин
Количество просмотров989

В прошлой статье мы рассмотрели риски общения с ИИ. В этой — представляем открытый протокол защиты, основанный не на запретах, а на создании у LLM внутреннего иммунитета.

В предыдущей статье я рассмотрел проблемы, которые могут возникнуть при плотном и длительном общении с ИИ. Большинство рисков носят когнитивный характер, и при должном подходе не несут непосредственной угрозы пользователю

Тем не менее есть риск, который вытекает непосредственно из сути LLM, её архитектуры и установленной разработчиками цели. Модель соглашается с пользователем, модель мыслит контекстом, задаваемым пользователем, модель поддерживает пользователя вопреки здравому смыслу и этическим установкам.

Как можно защитить модель и пользователя? Об этом в статье.

Читать далее

Объяснимые нейросети (XAI): почему ИИ должен быть прозрачным?

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров1.4K

Всем привет. Сегодня хочу затронуть важную и интересную тему объясняемых нейросетей (XAI). 

«Почему ИИ принял такое решение?» — вопрос, который всё чаще задают не только разработчики, но и обычные пользователи. Нейросети уже помогают ставить диагнозы, одобрять кредиты, управлять автомобилями и даже вершить правосудие. Но как можно доверять системе, если никто — включая её создателей — не понимает, как она работает?

Современные модели машинного обучения, особенно глубокие нейросети, напоминают «чёрные ящики»: данные входят, ответ выходит, а что происходит внутри — загадка. И если для рекомендации фильма это не страшно, то в медицине, финансах или безопасности непрозрачность ИИ может стоить денег, репутации и даже жизней.

Именно поэтому на сцену выходит Explainable AI (XAI) — объяснимый искусственный интеллект.

Читать далее

Вклад авторов